У администраторов соцсети появится возможность включить специальный фильтр враждебных высказываний в настройках сообщества, а комментаторы увидят предложение отказаться от обидных реплик. Оба инструмента работают на основе алгоритмов, в том числе нейросети, распознающей оскорбления, поясняется в сообщении.
Нейросеть удаляет комментарии, в которых содержатся угрозы, например, пожелания смерти или обещания причинить вред здоровью. При этом администратор сможет увидеть все комментарии, которые отсеял фильтр, и восстановить их или отправить автора в черный список. Как и другие фильтры в сообществах, фильтр враждебных высказываний можно включить или выключить в любой момент.
Также «ВКонтакте» масштабирует прошлогодний эксперимент: когда пользователь пишет комментарий, алгоритмы определяют, есть ли в тексте признаки оскорблений. Если есть, то автор получает совет не тратить время на агрессию и отказаться от обидной реплики. По данным соцсети, в 2019 году благодаря такому предупреждению за сутки удалось сократить количество оскорблений в комментариях на 36%.
В этот раз функция будет определять более широкий спектр оскорблений и угроз. Среди них — проявления нетерпимости по национальному признаку, а также враждебные высказывания на почве религиозной принадлежности, возраста, пола и других характеристик.
По результатам эксперимента команда «ВКонтакте» примет решение о дальнейшем использовании функции.
Ранее соцсеть «ВКонтакте» объявляла о начале тестирования нейросети для борьбы с хейтерами.