Все новости

Изучение и диагностика рака заметно ускорится благодаря большим языковым моделям

Они особенно хорошо подходят для извлечения информации из неструктурированного текста

МОСКВА, 17 июля. /ТАСС/. Большие языковые модели уже в ближайшее время значительным образом ускорят обработку медкарт пациентов для проведения медицинских и научных исследований, связанных с опухолями, так как они особенно хорошо подходят для извлечения информации из неструктурированного текста. Об этом сообщил ТАСС старший научный сотрудник Института AIRI Александр Нестеров.

"Главная особенность больших языковых моделей в том, что неструктурированный текст - естественная для них среда работы, а значит, они хорошо умеют выполнять большое количество задач, связанных его анализом. Их не нужно дообучать под задачу, как это требовалось делать для языковых моделей прошлого поколения. Вместе эти особенности позволяют с большой точностью извлекать из медицинских записей нужные данные, в том числе и о прогрессировании рака", - пояснил ученый.

На этой неделе американские ученые представили на международной научной конференции Американской ассоциации изучения рака (AACR) специализированную систему ИИ, способную анализировать неструктурированные данные из электронных карт пациентов и с высоким уровнем точности оценивать вероятность выживания носителей различных форм рака. Такой алгоритм использует в своей работе большие языковые модели и специальный подход для оценки качества извлекаемых данных.

Первые проведенные эксперименты с этой системой показали, что она не уступает в точности работы экспертам-медикам, что в перспективе позволит использовать ее для извлечения большого количества важных для медицины и науки данных из медкарт пациентов. Как отметил Нестеров, для практической реализации этих перспектив необходимо, чтобы новые медицинские системы ИИ обучались на максимальном количестве качественных данных.

"Адаптация больших языковых моделей для решения медицинских задач может производиться на нескольких уровнях. Первый - включение медицинских наборов данных в обучающие массивы, на которых тренируется модель. Второй - подбор специализированных инструкций для работы с медицинскими данными. Если говорить про обучение моделей, самое главное - это качество данных. Чем лучше данные - тем лучше работает модель", - добавил Нестеров.

По его словам, при корректном обучении и разумном контроле над работой систем ИИ на базе больших языковых моделей те смогут корректно понимать сложные и редкие медицинские термины, а также "видеть" другие тонкости, важные для интерпретации и структуризации неструктурированных медицинских данных. Решение всех вопросов позволит значительно ускорить развитие новых диагностических систем и внедрить их в практику, подытожил ученый.

Теги