Каждый штат в Соединенных Штатах требует, чтобы о случаях рака сообщалось в регистры рака штата для отслеживания заболеваний, выявления групп риска и выявления необычных тенденций или кластеров. Однако обычно занятые поставщики медицинских услуг представляют отчеты о раке в столь же загруженные отделы здравоохранения через несколько месяцев после начала лечения пациента, а не во время постановки диагноза.
Представителям здравоохранения может быть сложно интерпретировать эту информацию, что может еще больше задержать действия департамента здравоохранения, когда они потребуются. Исследователи Regenstrief Institute и IU продемонстрировали, что машинное обучение может значительно облегчить процесс, автоматически и быстро извлекая важное значение из открытого текста, также известного как произвольный текст, отчеты о патологии, и используя их для принятия решений.«На пути к лучшей отчетности в области общественного здравоохранения с использованием существующих готовых подходов: сравнение альтернативных подходов к обнаружению рака с использованием открытых медицинских данных и выбора функций, не основанных на словарях» опубликовано в апрельском выпуске журнала биомедицинской информатики за 2016 год.
«Мы думаем, что людям больше не нужно тратить время на просмотр текстовых отчетов, чтобы определить, присутствует ли рак», — сказал старший автор исследования Шон Граннис, доктор медицины, магистр наук, временный директор Центра биомедицинской информатики Regenstrief. «Мы подошли к тому моменту, когда технологии могут справиться с этим. Время человека лучше тратить на помощь другим людям, предоставляя им более качественную клиническую помощь».«Большая часть работы, которую мы будем делать в области информатики в следующие несколько лет, будет сосредоточена на том, как мы можем извлечь выгоду из машинного обучения и искусственного интеллекта.
Все — врачебные практики, системы здравоохранения, обмен медицинской информацией, страховые компании, а также а также департаменты здравоохранения — наводнены океаном данных. Как мы можем надеяться разобраться в этом потоке данных? Люди не могут этого сделать, но компьютеры могут ».
Доктор Граннис, исследователь Института Регенстриф и адъюнкт-профессор семейной медицины Медицинской школы IU, является разработчиком синдромного детектора наблюдения за инфекционными заболеваниями Regenstrief и руководил технической реализацией Системы наблюдения за чрезвычайными ситуациями в области общественного здравоохранения штата Индиана — одной из самая большая нация. Исследования, проведенные за последнее десятилетие, показали, что эта система обнаруживает вспышки инфекционных заболеваний на семь-девять дней раньше и обнаруживает в четыре раза больше случаев, чем люди, сообщающие о них, при этом обеспечивая более полные данные.«Также интересно то, что наши усилия демонстрируют значительный потенциал для использования в странах с недостаточным уровнем обеспеченности услугами, где большинство клинических данных собирается в форме неструктурированного свободного текста», — сказал первый автор исследования Суранга Н. Кастуриратн, докторант Школы информатики. и вычисления в IUPUI. «Кроме того, в дополнение к обнаружению рака, наш подход может быть применен и для широкого круга других состояний».
Исследователи отобрали 7000 отчетов о патологии в свободном тексте из более чем 30 больниц, которые участвуют в обмене медицинской информацией штата Индиана, и использовали инструменты с открытым исходным кодом, алгоритмы классификации и различные подходы к выбору функций, чтобы предсказать, был ли отчет положительным или отрицательным для рака. Результаты показали, что полностью автоматизированный обзор дал результаты, аналогичные или лучше, чем у подготовленных рецензентов, что позволило сэкономить время и деньги.
«Машинное обучение теперь может поддерживать идеи и концепции, о которых мы знали на протяжении десятилетий, например, базовое понимание медицинских терминов», — сказал д-р Граннис. «Мы обнаружили, что искусственный интеллект не менее точен, чем люди, в выявлении случаев рака на основе клинических данных с произвольным текстом. Например, компьютер« узнал », что слово« лист »или« листы »означает рак как« лист »или« листы ». клеток »используются в отчетах о патологии для обозначения злокачественности.
«Это не прогресс в идеях, это крупный прогресс в инфраструктуре — у нас есть технология, у нас есть данные, у нас есть программное обеспечение, с помощью которого мы наблюдали точный и быстрый анализ огромных объемов данных без надзора или контроля со стороны человека».
