Улучшена работа способных ускорить разработку полезных веществ нейросетей
Метод позволяет уменьшить набор необходимых данных в 50 раз и при этом сохранить высокую точность результатов нейросетевых расчетов
МОСКВА, 11 июля. /ТАСС/. Российские и европейские исследователи разработали новый подход использования систем ИИ для предсказания поведения молекул. Метод позволит быстрее разрабатывать новые лекарства и синтезировать другие полезные молекулы, требуя при этом в 50 раз меньше данных, чем существующие нейросети такого рода, сообщила пресс-служба Института искусственного интеллекта AIRI.
"Традиционно в фармацевтике разработка лекарственного препарата от идеи до выхода на рынок может занимать до 10-20 лет. Нейросети меняют эту ситуацию. Уже сейчас несколько молекул, предложенных нейросетями, проходят клинические испытания, хотя самой идее нейронных потенциалов нет и 10 лет. Мы надеемся, что наши разработки помогут ускорить этот процесс еще сильнее", - пояснил руководитель группы "Глубокое обучение в науках о жизни" AIRI Артур Кадурин, чьи слова приводит пресс-служба института.
Как отмечают исследователи, в настоящее время химики и биологи используют методы квантовой химии для предсказания поведения молекул, которые исследователи планируют изучить или синтезировать. Проведение подобных расчетов требует огромного количества времени и вычислительных ресурсов, так как их сложность возрастает с добавлением каждого нового атома и электрона, присутствующего в молекуле или участвующего в химических реакциях.
В последние годы ученые пытаются обойти эти проблемы при помощи квантовых компьютеров и нейросетей, способных определять, как будут взаимодействовать атомы в произвольно устроенных молекулах. Подобные системы ИИ способны получать ответы, сопоставимые по точности с результатами квантово-химических расчетов, однако для этого требуется огромный массив данных для обучения, около 500 тыс. вариаций структуры молекул, каждую из которых нужно просчитать при помощи методов квантовой химии.
Российские и европейские исследователи разработали новый подход для обучения подобных систем ИИ (GOLF). Метод позволяет уменьшить набор необходимых данных в 50 раз и при этом сохранить высокую точность результатов нейросетевых расчетов. Основой разработки стало активное обучение, в рамках которого алгоритм GOLF отслеживает появление проблем в процессе тренировки нейросети и добавляет в обучающий набор те варианты молекул, при работе с которыми система ИИ испытывает сложности.
Работу этого алгоритма исследователи проверили на двух базах данных, в которых содержится информация по структуре большого числа небольших молекул. Проведенные расчеты подтвердили, что GOLF позволяет значительным образом ускорить работу квантово-химической нейросети и при этом сохраняет высокую точность расчетов. Схожим образом разработка Кадурина и его коллег справилась с предсказанием структуры двух тысяч сложно устроенных молекул, что говорит о широкой применимости данного подхода для решения практических задач, связанных с фармацевтикой и химией.