Максим, почему фильтрующий бот удаляет вообще все сообщения со словами Rust/Раст?То, что IT-корпорации из США агрессивно продвигают Rust, пытаясь заменить на него дедушку C/C++, потому что он для них экономически выгоднее и удобнее, современнее, в чём-то безопаснее итд, уже давно ни для кого не секрет.
Кроме того, они этого никогда и не скрывали и здесь нет никакой "теории заговора", это же подтверждает официально и нейронка от Google, прямо в результатах поиска, вот для примера:
https://www.google.com/search?q=google+продвигает+rust
https://www.google.com/search?q=microsoft+продвигает+rust
https://www.google.com/search?q=apple+продвигает+rustПочему opennet.ru не признаёт данный факт и борется с ним, как можно утверждать обратное, если это не соответствует действительности?
> Максим, почему фильтрующий бот удаляет вообще все сообщения со словами Rust/Раст?Можете показать конкретное удалённое сообщение или хотябы ветку в которой оно было удалено?
Сообщения про Rust обычно удаляются только если они публикуются не к месту в ветках, не имеющих отношение к Rust, или в них явный троллинг.
>> Максим, почему фильтрующий бот удаляет вообще все сообщения со словами Rust/Раст?
> Можете показать конкретное удалённое сообщение или хотябы ветку в которой оно было
> удалено?
> Сообщения про Rust обычно удаляются только если они публикуются не к месту
> в ветках, не имеющих отношение к Rust, или в них явный
> троллинг.Да, я так и понял, что они удаляются из всех новостей, где не фигурирует ЯП Rust.
(При этом, к примеру, не удаляется эмоциональное сообщение, не несущее смысловой нагрузки и подобное, сам протестировал только что.)
Можно прийти к выводу, что к языку Rust при автомодерации проявляется "повышенное внимание", ну то есть это предвзятое отношение.
При этом корпорации продвигают Rust одновременно по всем направлениям, по которым только могут, он скоро будет, грубо говоря, "везде", они его преподносят, как "ЯП Будущего".
И, как следствие, учитывая общую ситуацию, при очередных соприкосновениях, не может не происходить ложных удалений, и чем дальше, тем больше сообщений будет удалено абсолютно необоснованно. Что в конечном счёте сделает даже адекватное обсуждение попросту невозможным и часть тем не будет раскрыта в комментариях вовсе.
Естественно, речь идёт только про адекватные сообщения, несущие качественную смысловую нагрузку, при этом необходимо продолжать удалять весь "троллинг", спам и подобное.
Поэтому, я предлагаю использовать современную фильтрующую системы, специфически настроенную под тематику ресурса, для автоматической модерации комментариев на базе нейронной сети, и топорная рубка всего подряд ботом будет заменена на "логически осмысленную" модерацию.
Под каждой второй новостью, не связанной с Rust, обязательно кто-нибудь троллит комментариями типа "когда перепишут на Rust" или "с Rust такой уязвимости не было бы". Такие комментарии удаляются, если они ради флуда, а не по делу. По поводу повышенного внимая бота, причина здесь не в Rust, а в использовании слов типа "растоман".Бот удаляет, учитывая только опыт прошлых ручных удалений на opennet. Общие большие языковые модели для модерирования у меня пока не получилось задействовать, в экспериментах они слишком строго оценивают нарушения и получается много ложных срабатываний, так как они проваливаются в цензурирование.
https://huggingface.co/sismetanin/rubert-toxic-pikabu-2ch"Мы доработали две версии многоязычного универсального кодировщика предложений (M-USE), многоязычные представления двунаправленных кодировщиков от Transformers (M-BERT) и RuBERT для обнаружения токсичных комментариев на русском языке.
Kaggle Russian Language Toxic Comments Dataset представляет собой сборник русскоязычных аннотированных комментариев от 2ch и Pikabu."
Это старая модель пятилетней давности и обучена она на 4826 удалённых и 9586 нормальных комментариев. Будет время поэкспериментирую с ней. Сейчас на opennet используется классификатор FastText от Facebook, обученный на 450 тысячах удалённых и 2 млн нормальных комментариях.Пару лет назад я сравнивал похожую на rubert модель (какую точно уже не помню) с тем, что сейчас, результаты были в пользу FastText.
Максим, откровенно говоря, автомодерация работает просто напросто плохо. Убивая под час желание в принципе давать полные развёрнутые ответы, ибо нет гарантии, что сообщение не будет автоматически удалено.
> Максим, откровенно говоря, автомодерация работает просто напросто плохо. Убивая под час
> желание в принципе давать полные развёрнутые ответы, ибо нет гарантии, что
> сообщение не будет автоматически удалено.И сразу "скрыто модератором", это победа!
Бот скрыл за обсуждение автомодерирования :-) Логика в том, что сообщение распознано как обращение к модератору и после скрытия модератор такое сообщение обязательно увидит и отреагирует.
AI-модератор не удаляет, а только скрывает. Скрытие - это своеобразная премодерация, все скрытые сообщения просматриваются и ошибочные скрытия раскрываются.