Алгоритмы искусственного интеллекта, лежащие в основе программы чат-ботов ChatGPT, которая привлекла внимание своей способностью генерировать человеческие письменные ответы на некоторые из самых творческих запросов, однажды могут помочь врачам выявлять болезнь Альцгеймера на ранних стадиях. Исследования недавно продемонстрировали, что программа OpenAI GPT-3 может идентифицировать подсказки из спонтанной речи, которые с точностью 80% позволяют прогнозировать ранние стадии деменции.
Исследование Школы биомедицинской инженерии, науки и систем здравоохранения Университета Дрекселя является последним в серии усилий, направленных на демонстрацию эффективности программ обработки естественного языка для раннего прогнозирования болезни Альцгеймера — с использованием текущих исследований, предполагающих, что нарушение речи может быть ранним индикатором нейродегенеративных расстройств.
Текущая практика диагностики болезни Альцгеймера обычно включает в себя изучение истории болезни и длительный набор физических и неврологических обследований и тестов. Хотя до сих пор нет лекарства от этой болезни, ее раннее выявление может дать пациентам больше возможностей для терапии и поддержки. Поскольку нарушение речи является симптомом у 60-80% пациентов с деменцией, исследователи сосредоточили свое внимание на программах, которые могут улавливать едва уловимые подсказки -- такие как запинания, грамматические ошибки, ошибки в произношении и забывание значения слов -- в качестве экспресс-теста, который может указать, следует ли пациенту пройти полное обследование.
«Из текущих исследований мы знаем, что когнитивные последствия болезни Альцгеймера могут проявляться в воспроизведении речи», — сказал Хуалоу Лян, соавтор исследования. «Наиболее часто используемые тесты для раннего выявления болезни Альцгеймера смотрят на акустические особенности, такие как паузы, артикуляция и качество голоса, в дополнение к тестам на познание. Но мы считаем, что усовершенствование программ обработки естественного языка открывает еще один путь к раннему выявлению болезни Альцгеймера».
Третье поколение алгоритма обработки естественного языка GPT-3 (General Pretrained Transformer 3) от OpenAI, использует алгоритм глубокого обучения, обученный путем обработки обширных массивов информации из Интернета, с особым акцентом на то, как используются слова и как строится язык. Это обучение позволяет ему по-человечески реагировать на любую задачу, связанную с языком, от ответов на простые вопросы до написания стихов или эссе.
GPT-3 особенно хорош в «обучении с нулевыми данными» — это означает, что он может отвечать на вопросы, которые обычно требуют внешних знаний, которые не были предоставлены. Например, попросив программу написать «CliffsNotes» для текста, обычно требуется объяснение, что это означает краткое изложение. Но GPT-3 прошел достаточное обучение, чтобы понять отсылку и адаптироваться для выработки ожидаемого ответа.
«Системный подход GPT3 к анализу языка и продуцированию делает его многообещающим кандидатом для выявления тонких речевых характеристик, которые могут предсказать начало деменции», — сказал Феликс Агбавор, ведущий автор статьи. «Обучение GPT-3 на большом наборе данных интервью, некоторые из которых касаются пациентов с болезнью Альцгеймера, предоставит ему информацию, необходимую для извлечения речевых паттернов, которые затем можно будет применять для выявления маркеров у будущих пациентов».
Исследователи проверили свою теорию, обучив программу набором расшифровок части набора данных речевых записей, составленного при поддержке Национального института здравоохранения специально для проверки способности программ обработки естественного языка предсказывать деменцию. Программа зафиксировала значимые характеристики словоупотребления, структуры предложений и значения текста, чтобы создать то, что исследователи называют «встраиванием» — характерный профиль речи больного Альцгеймером.
Затем они использовали встраивание для переобучения программы, превратив ее в машину для скрининга болезни Альцгеймера. Чтобы протестировать это, они попросили программу просмотреть десятки расшифровок из набора данных и решить, была ли каждая из них произведена кем-то, у кого развилась болезнь Альцгеймера.
Запустив две лучшие программы обработки естественного языка с одинаковой скоростью, группа обнаружила, что GPT-3 работает лучше, чем обе, с точки зрения точного определения примеров болезни Альцгеймера, выявления примеров, не связанных с болезнью Альцгеймера, и с меньшим количеством пропущенных случаев, чем обе программы.
Во втором тесте использовался текстовый анализ GPT-3 для прогнозирования оценок различных пациентов из набора данных по общему тесту для прогнозирования тяжести деменции, который называется Mini-Mental State Exam (MMSE).
Затем команда сравнила точность предсказания GPT-3 с точностью анализа, использующего только акустические особенности в записях, такие как паузы, сила голоса и невнятность, для предсказания оценки MMSE. GPT-3 оказался почти на 20% более точным в прогнозировании показателей MMSE пациентов.
«Наши результаты показывают, что встраивание текста, сгенерированное GPT-3, может быть надежно использовано не только для выявления людей с болезнью Альцгеймера среди здоровых людей, но также сделать вывод о баллах когнитивного тестирования субъекта, основанных исключительно на речевых данных», — написали исследователи. «Мы также показываем, что встраивание текста превосходит традиционный подход, основанный на акустических характеристиках, и даже конкурентоспособно с точно настроенными моделями. Все эти результаты в совокупности свидетельствуют о том, что встраивание текста на основе GPT-3 является многообещающим подходом к оценке болезни Альцгеймера и может улучшить раннюю диагностику деменции».
Чтобы развить эти многообещающие результаты, исследователи планируют разработать веб-приложение, которое можно будет использовать дома или в кабинете врача в качестве инструмента предварительного скрининга.
«Наша проверка концепции показывает, что это может быть простой, доступный и достаточно чувствительный инструмент для тестирования на уровне сообщества», — сказал Лян. «Это может быть очень полезно для раннего скрининга и оценки риска до постановки клинического диагноза».
В своей статье, опубликованной в журнале PLOS Digital Health.
Источник: Drexel University.