Все новости

Эксперты: безопасность и соцразвитие почти не уступают политике в токсичности обсуждений

Исследователи сделали такой вывод, проанализировав 521 тыс. постов и более 19 тыс. комментариев на сайте Pikabu

МОСКВА, 6 октября. /ТАСС/. Российские социологи проанализировали при помощи нейросети комментарии на одной из популярных российских платформ для обсуждений и обнаружили, что самые токсичные комментарии пользователи оставляли в обсуждениях по политике, безопасности и соцразвитию. Все остальные дискуссии вызывали значительно меньше негатива, сообщила в четверг пресс-служба НИУ ВШЭ.

"Для классификации токсичных комментариев мы вручную разметили набор данных через Yandex.Toloka и провели эксперименты по обучению классификаторов на основе языковых моделей RuBERT и ToxicRuBERT. В наших исследованиях по классификации токсичности и настроений в русскоязычных текстах эти модели демонстрировали более высокое качество классификации, чем другие", - заявил научный сотрудник НИУ ВШЭ (Москва) Сергей Сметанин, чьи слова приводит пресс-служба вуза.

В последние годы люди начали говорить о стремительно растущей токсичности обсуждений в социальных сетях. Ученые связывают это как с реальным увеличением политической напряженности и поляризацией мнений во многих странах, так и с тем, что существующие алгоритмы социальных сетей и поисковых систем способствуют формированию обособленных группировок единомышленников, которые почти не контактируют с другим мнением.

Сметанин и его коллеги заинтересовались, как это происходит в России. Ученые изучили корпус из 521 050 постов и 19 275 438 комментариев, размещенных в 2019 году на сайте Pikabu.

Нейросетевой детектор токсичности

В этот набор сообщений входили не только политические темы, традиционно вызывающие разногласия, но и другие дискуссии, в том числе связанные со здоровьем, социально-экономическим положением людей, безопасностью, окружающей средой и возможностями трудоустройства. Ученые изучили несколько тысяч сообщений из этого набора, определили уровень их токсичности и использовали эти сведения для обучения нейросетей RuBERT и ToxicRuBERT.

Это позволило им создать алгоритм, который автоматически выявлял токсичные сообщения в обсуждениях тех или иных вопросов в соцсети и классифицировал их по тематике обсуждения. Используя этот подход, исследователи подтвердили, что политика, действительно, самая токсичная тема для обсуждения, однако с ней активно конкурируют два других аспекта общественной жизни - безопасность и социальное развитие. Все остальные темы оказались менее спорными.

По мнению ученых, алгоритм могут использовать владельцы Pikabu и других российских соцсетей для выявления наиболее токсичных комментариев и пользователей, а также последующей оценки их действий. В перспективе, это позволит повысить культуру обсуждений самых острых тем.

"Будущие исследования могут быть связаны с изучением особенностей распространения токсичного контента. Некоторые исследования уже показывают, что такой может быть заразным: грубость и неуважение к собеседнику со стороны одного пользователя приводят к тому, что и другие пользователи отвечают в схожем ключе", - подытожил Сметанин.