«Твиттер — это краткое изложение того, кто мы есть», — сказал Х. Эндрю Шварц, доктор философии, приглашенный доцент кафедры компьютерных и информационных наук Университета Пенсильвании и Лаборатории инноваций в области социальных сетей и здравоохранения Пенсильвании. «Язык, который мы пишем, отражает нашу повседневную жизнь. Он отражает те аспекты людей, которые в остальном совершенно неуловимы для исследователей в области здравоохранения, например, психологическую сторону, до которой трудно добраться».
Это те аспекты, которые могут быть упущены при традиционном — и медленно публикующемся — эпиднадзоре за болезнями, исследованиях и опросах. Исследования показали, что использование больших данных Твиттера помогает лучше прогнозировать вспышки гриппа и приступы астмы. "Этот насморк не прекратится!" и хэштег "#wheezing" может быть очень красноречивым.
Подобные твиты также могут выявить общие тенденции в области здравоохранения, которые могут послужить основой для кампаний и мероприятий, направленных на помощь людям с множеством заболеваний, как обсуждали исследователи Пенна в октябрьском исследовании 2015 года, в котором участвовали Шварц и старший автор, Райна М. Мерчант, доктор медицины, MSHP, директор Лаборатории инноваций в социальных сетях и здравоохранении. Менее очевидные твиты также дают исследователям Пенна лучшее представление о здоровье.
Анализ более 150 миллионов твитов выявил полезную информацию о ВИЧ в сообществах в Соединенных Штатах и о людях, которые в них живут.Твиты с активными действиями — написанные со словами «иди», «действуй», «работай», «занимайся» — гораздо чаще исходили от людей, живущих в округах с более низким уровнем ВИЧ, чем от людей, живущих в округах с более высоким уровнем ВИЧ. Шварц и его коллеги сообщили в журнале AIDS and Behavior в прошлом году. Среди авторов исследования также были Лайл Ангар, доктор философии, профессор компьютерных наук в Пенсильвании, и Долорес Альбаррасин, доктор философии, бывший профессор коммуникации и психологии в Пенсильвании, которая в настоящее время преподает в Иллинойском университете в Урбане-Шампейн.
Это не были твиты типа «Я ВИЧ-положительный» или «Я собираюсь пройти тестирование», которые отслеживались в ходе прошлых исследований. Это было больше об общих целях или представлениях, например, «Я планирую…» или «Я побью тебя на…». Используя словарь из 854 слов для своего анализа, команда решила ответить, соответствует ли этот тип языка случаям ВИЧ.
В сфере здравоохранения эти твиты о действиях были связаны с повышенной физической активностью, но как это отразилось в сфере борьбы с ВИЧ, было неясно.
По словам авторов, пребывание в активной общественной среде может способствовать более быстрой диагностике и лечению ВИЧ, что в конечном итоге может помочь снизить передачу и распространенность болезни.Твиты могли быть разными: в сторону принятия более позитивных решений в отношении здоровья или в сторону рискованного поведения, которое может увеличить шанс человека заразиться болезнью. Первое было верным в данном случае и, как описали авторы, было критически информативным, с «потенциалом очень преобразующего для практики профилактики и наблюдения».
Сегодня результаты крупномасштабных опросов по выявлению индивидуальных и общественных факторов риска ВИЧ и других инфекционных заболеваний могут проявиться годами, поэтому просмотр в реальном времени разговоров, происходящих в Твиттере, может оказаться очень полезным, Альбаррасин, Ангар , и их коллеги обсуждают на своей странице группы здравоохранения и социальных сетей. «Чтобы эффективно бороться с ВИЧ, — писали они, — нам нужно знать, на что нужно направить лечебные ресурсы и где возникают новые риски для здоровья». Другими словами, данные часто оказываются слишком запоздалыми.По словам авторов исследования AIDS and Behavior, с помощью Twitter и сложных методов геокодирования исследователи общественного здравоохранения могут потенциально оценить текущий риск заражения ВИЧ в конкретных местах и принять превентивные меры до того, как произойдет фактическая вспышка.
«Этот тип данных может использоваться для вмешательства в общественное здравоохранение», — сказал Шварц, который также является доцентом кафедры компьютерных наук в Университете Стони Брук. «Обладая этой информацией, вы можете использовать рейтинг того, насколько сообщество ориентировано на действия и где вы, возможно, захотите вмешаться, и начать некоторые программы по повышению осведомленности о ВИЧ».Этот подход с использованием больших данных выходит за рамки ВИЧ.
Шварц и его коллеги изучают множество других заболеваний, таких как диабет, чтобы увидеть, что могут выявить прогностические возможности и ассоциации Twitter. Интересно, что предварительные результаты показывают связь между словом «церковь» в социальных сетях и более высокими показателями диабета, сказал он. Ожидается, что полные результаты будут опубликованы в этом году.
Все это часть продолжающейся работы с «обработкой естественного языка» в лаборатории социальных сетей в Пенсильвании, а также в Стони-Брук и Университете Иллинойса, каждый из которых включает многопрофильную команду исследователей с опытом работы в медицине, юриспруденции и компьютерах. наука, демография, географические информационные системы, биостатистика, политика здравоохранения, коммуникации, маркетинг, дизайн, поведенческое здоровье и управление операциями.«Facebook и Twitter открывают возможность просматривать открытый словарный запас, неожиданные языковые шаблоны, опубликованные« в дикой природе », — сказал Шварц. «Мы изучаем множество болезней и их связи с языком — какие из них мы можем хорошо предсказать, а какие нет».
