Поиск ключей к достоверности в Twitter: миллионы твитов проанализированы, чтобы измерить предполагаемую надежность

«В последние годы было проведено много исследований доверия в социальных сетях, но очень мало известно о том, какие типы слов или фраз вызывают доверие во время быстро разворачивающихся событий», — сказала Танушри Митра, доктор философии Технологического института Джорджии. кандидат, руководивший исследованием.Команда изучила твиты, посвященные событиям 2014 и 2015 годов, включая появление вируса Эбола в Западной Африке, атаку Charlie Hebdo в Париже и смерть Эрика Гарнера в Нью-Йорке.

Они просили людей оценивать сообщения по степени их правдоподобия (от «безусловно точных» до «безусловно неточных»). Затем команда ввела слова в модель, которая разделила их на 15 различных лингвистических категорий. Классификация включала положительные и отрицательные эмоции, преграды и стимулы, а также тревогу.Затем компьютер Технологического института Джорджии проверил слова, чтобы определить, достоверны ли твиты.

Это совпадало с мнением людей примерно в 68% случаев. Это значительно выше случайного базового значения в 25 процентов.«Твиты со вспомогательными словами, такими как« бесспорно », и положительными эмоциями, такими как« нетерпеливый »и« потрясающий », были сочтены весьма заслуживающими доверия», — сказал Митра. «Слова, указывающие на позитивные настроения, но высмеивающие непрактичность события, такие как« ха »,« ухмылка »или« шутка », были сочтены менее заслуживающими доверия. Так же были слова хеджирования, включая« определенный уровень »и« подозреваемые »».

Более высокое количество ретвитов также коррелировало с более низкими оценками достоверности. Ответы и ретвиты с более длинными сообщениями считались более достоверными.

«Возможно, более длинные сообщения содержат больше информации или аргументов, поэтому они считаются более заслуживающими доверия», — сказала она. «С другой стороны, большее количество ретвитов, которые получили более низкую оценку по степени достоверности, может представлять собой попытку вызвать коллективные рассуждения во время кризиса или неопределенности».Система еще не может быть развернута, но команда Технологического института Джорджии заявляет, что в конечном итоге она может стать приложением, которое будет отображать предполагаемую достоверность события по мере его развертывания в социальных сетях.

«В сочетании с другими сигналами, такими как темы событий или структурная информация, наш лингвистический результат может стать важным строительным блоком автоматизированной системы», — сказал Эрик Гилберт, советник Mitra и доцент Школы интерактивных вычислений Технологического института Джорджии. «Твиттер — это часть проблемы распространения неправдивых новостей в Интернете. Но он также может быть частью решения».

Документ «Экономная языковая модель доверия к социальным сетям в различных событиях» будет представлен в феврале на 20-й конференции ACM по совместной работе с компьютерной поддержкой и социальным вычислениям в Портленде, штат Орегон.