Специалисты из Microsoft Research и Техниона – Израильского технологического института(Хайфа)опубликовали научную работу с описанием методов дата-майнинга большущего архива новостных текстов. Разбор позволяет выявить найденные стандарты, какие указывают на увеличение вероятности конкретных событий — эпидемий, кончин и революций. Авторы научной работы полагают, что путем самодействующего разбора текущих новинок можно заблаговременно прогнозировать наступление таковских событий.
В рамках научной работы был проложен дата-майнинг статей газеты New York Times с 1986 по 2008 год, то жрать за 22 года. Вдобавок, в модель включили информацию из иных разинутых ключей, таковских будто Wikipedia, FreeBase, OpenCyc и GeoNames. Ученым удалось разработать самообучаемую нейросеть, какая выявляет найденную последовательность событий, предшествующих найденному исходу.
Авторы болтают, что их метод можно использовать для пророчества и предотвращения нежелательных событий в предбудущем. Для этого довольно преступить вышеупомянутую цепочку, какая предшествует исходу. И навыворот, дабы нечто приключилось в предбудущем, надобно создать отвечающую цепочку событий.
Изображенные в научной работе модели демонстрируют точность прогнозов от 70% до 90%, с вероятностью предотвращения от 30% до 60%.
На иллюстрации показано, что вспышке холеры в Анголе в январе 2007 года предшествовала засуха в январе 2006 года и ураган в январе 2007 года. Нейросеть нашла, что вспышка холеры связана собственно с этими событиями. Самосильно от программы, к таковским же выводам опамятовались эпидемиологи.
Ученые предлагают упражнять нейросеть и отдаленнее, увеличивая численность информации для нее. С этой мишенью надобно осуществлять раздельный дата-майнинг по регионам, что позволит улучшить модели и повысить точность прогнозов.
