Исследователи используют поисковые системы и социальные сети для прогнозирования тенденций сифилиса.

Два исследования Института прогнозных технологий Калифорнийского университета в Калифорнийском университете в сотрудничестве с Центрами по контролю и профилактике заболеваний (CDC) обнаружили связь между определенными терминами, связанными с риском, которые пользователи Google и Twitter исследовали или писали в Твиттере, и последующим сифилисом. тенденции, о которых было сообщено в CDC. Исследователи смогли выявить эти случаи на уровне штата или округа, в зависимости от используемой платформы.

«Многие из наиболее серьезных проблем общественного здравоохранения в нашем современном обществе — ВИЧ и инфекции, передаваемые половым путем, злоупотребление опиоидами и рак — можно было бы предотвратить, если бы у нас были более точные данные о том, когда и где эти проблемы возникали», — сказал Шон Янг, основатель. и директор Центра цифрового поведения Калифорнийского университета в Лос-Анджелесе и Института технологий прогнозирования Калифорнийского университета. «Эти два исследования показывают, что данные поиска в социальных сетях и Интернете могут помочь решить эту проблему, предсказав, когда и где в будущем могут возникнуть случаи сифилиса. Это может быть инструмент, который могут использовать государственные органы, такие как CDC», — добавил Янг. также адъюнкт-профессор семейной медицины в Медицинской школе Дэвида Геффена в Калифорнийском университете в Лос-Анджелесе.

В одном исследовании, которое будет опубликовано в рецензируемом журнале Epidemiology, изучалась связь между поисковыми запросами на уровне штата в Google с первичными и вторичными случаями сифилиса — наиболее ранними и наиболее передающимися стадиями инфекции, передаваемой половым путем, — о которых впоследствии сообщалось. в этих государствах.Для этого исследования исследователи собрали данные для 25 ключевых слов и фраз (таких как «найти секс» и «ИППП»), собранные в Google Trends с 1 января 2012 г. по 31 декабря 2014 г. Они также получили данные на уровне округа за неделю. данные о сифилисе от CDC, охватывающие тот же период времени для всех 50 штатов, объединили эти данные по штатам и сопоставили их с еженедельными данными Google Trends, которые они собирали.В исследовании использовалась модель статистической информатики, называемая машинным обучением, которая может просматривать большие объемы данных, чтобы находить закономерности и предсказывать эти закономерности.

Эта основанная на искусственном интеллекте машина изучала взаимосвязь между поисковыми запросами людей в Google, связанными с сифилисом, и фактическими показателями заболеваемости сифилисом за определенный период времени. Изучив эту закономерность, он проверил, можно ли точно предсказать будущие случаи сифилиса, используя только связанные с сифилисом поисковые запросы Google.

Исследователи обнаружили, что модель предсказала 144 недели подсчета сифилиса для каждого штата с точностью 90 процентов, что позволяет им предсказать тенденции сифилиса на уровне штата до того, как они возникнут.Исследователи из института обнаружили, что то же самое верно и в отношении Twitter.

В исследовании, опубликованном в Preventive Medicine, они взяли данные Twitter на уровне округов с 26 мая по 9 декабря 2012 года, что составило 8 538 твитов с географической привязкой. Как и в случае с анализом Google Trends, исследователи составили список слов, связанных с рискованным сексуальным поведением.Они еженедельно рассматривали случаи первичного и вторичного сифилиса и раннего латентного сифилиса на уровне округа (инфекция в течение предыдущих 12 месяцев без очевидных симптомов), которые, вероятно, произошли в течение предыдущих 12 месяцев. Случаи были из 50 штатов и Вашингтона, округ Колумбия, о них сообщалось в CDC с 2012 по 2013 годы.

Данные за 2012 год были включены, потому что предыдущие показатели сифилиса в округе, вероятно, предсказывают будущие показатели, и они хотели определить, как Twitter- метод на основе будет работать в соответствии с данными за предыдущий год.Они обнаружили, что округа, в которых в 2012 г. было больше сообщений о рисках, были связаны с увеличением числа случаев первичного и вторичного сифилиса на 2,7% и увеличением числа случаев раннего латентного сифилиса в 2013 г. связанных с увеличением на 0,6 процента и 0,4 процента случаев первичного / вторичного и раннего латентного сифилиса в 2013 году, соответственно, что позволяет предположить, что модель на основе Twitter работает так же, как и просто с использованием данных о сифилисе за предыдущий год. Это важно, потому что данные Twitter чрезвычайно недорогие и предполагают, что данные социальных сетей являются недорогой альтернативой для прогнозирования сифилиса.Оба исследования имеют определенные ограничения.

В документе Google они включают вероятность того, что о многих случаях первичного и вторичного сифилиса не сообщается; результаты были смещены в сторону пользователей Google, которые составляют около 64 процентов пользователей поисковых систем; а данные Google Trends представляют собой случайную выборку всех данных, а не полного набора данных, что могло повлиять на работу модели. В случае исследования Twitter данные были основаны на пользователях Twitter, которые представляют собой избранную выборку людей; исследователи рассмотрели данные только за 2012 и 2013 годы, когда для разработки соответствующих ответных мер общественного здравоохранения потребовались бы данные за более длительный период времени; а в некоторых районах с большим количеством случаев сифилиса могли быть сообщения общественного здравоохранения через социальные сети, которые содержали соответствующие ключевые слова, которые были включены в данные, изученные исследователями.


Новости со всего мира