Все новости

Разработка ученых РФ позволит искусственному интеллекту быстрее определять заболевания

Речь идет о методах для построения алгоритмов классификации

ТАСС, 30 октября. Разработанные в Томском госуниверситете систем управления и радиоэлектроники (ТУСУР) методы для построения алгоритмов классификации позволят искусственному интеллекту (ИИ) принимать правильные решения при несбалансированных данных, в том числе при анализе диагностических данных пациентов. Об этом в среду сообщила пресс-служба вуза.

"Ученые факультета безопасности ТУСУР разрабатывают новые методы для построения алгоритмов классификации (нечетких классификаторов), которые позволят ИИ принимать правильные решения при несбалансированных данных", - говорится в сообщении.

В настоящее время ИИ и его элементы все чаще применяют в медицине, банковском деле и IT-сфере. Однако до сих пор существует проблема точности ИИ, особенно в случаях работы с несбалансированными данными, ведь в самых разных отраслях может возникнуть ситуация, когда данных одних классов существенно больше, чем данных других. При этом зачастую именно экземпляры наименьших классов являются важнейшими для исследователей.

"В качестве примера несбалансированных данных можно привести анализ базы данных пациентов, сдавших кровь: большинство, вероятнее всего, будут здоровы, а заболевших, которых нужно выявить, окажется значительно меньше. Универсальные алгоритмы не эффективны в решении данной задачи, что приводит к невозможности обработки данных с высоким уровнем точности для последующего практического использования. Один из наиболее распространенных сейчас подходов - исправление самих данных: чтобы уменьшить дисбаланс, либо вырезаются те, которые принадлежат к классам большинства, либо синтезируются и включаются в таблицу наблюдения дополнительные целевые данные. На наш взгляд, такой подход не совсем верный: если мы обрезаем данные, то можем потерять часть важной информации, если добавляем, то может возникнуть путаница с реальными данными, искусственное пересечение классов", - приводятся в сообщении слова одного из авторов разработки, аспирантки ТУСУР Марины Бардамовой.

По ее словам, исследователи ТУСУР используют метаэвристические алгоритмы для отбора информативных признаков, которые позволяют настраивать нечеткие классификаторы таким образом, чтобы отсеять избыточные признаки, оптимизировать параметры, повысить точность классификации и разделить данные по конечным классам. Процесс обучения классификаторов осуществляется на основе реальных данных, предоставленных в том числе медицинскими учреждениями, добавила исследователь, которая ведет проект в рамках гранта Российского фонда фундаментальных исследований.

Нечеткие классификаторы, отметила Бардамова, будут полезны в первую очередь в медицине, где зачастую у данных размыты границы, например, когда болезнь только начинается, и человеку трудно выделить явные признаки. "Если обучить ИИ работать с такими несбалансированными данными, он поможет врачам определять заболевания уже на начальных стадиях", - сказала Бардамова.

Теги