Повышена эффективность обучения генеративных потоковых нейросетей
Эта методика ускорит разработку ИИ, способных искать новые лекарства
МОСКВА, 21 августа. /ТАСС/. Исследователи из России разработали подход, позволяющий значительным образом повысить эффективность обучения генеративных потоковых нейросетей, предназначенных для работы с неструктурированными задачами. Эта методика ускорит разработку ИИ, способных искать новые лекарства, сообщила пресс-служба НИУ ВШЭ.
"Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов, чем уже существующие и применяемые на практике методы. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением", - пояснил младший научный сотрудник Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Никита Морозов, чьи слова приводит пресс-служба вуза.
Как объясняют исследователи, генеративные потоковые сети представляют особый тип алгоритмов машинного обучения, который строит сложные объекты шаг за шагом. Ученые применяют их для поиска белков, лекарств и оптимизации транспортных систем. Для решения этих задач ИИ должен научиться понимать и манипулировать свойствами объектов, которые хочет получить их пользователь.
Как правило, они состоят из двух компонентов - прямой и обратной модели. Первая постепенно конструирует сложные объекты из некого набора базовых блоков, а вторая - "разбирает" их и определяет цепочку шагов, которая привела к появлению этой конструкции. Для корректной и стабильной работы этой формы ИИ необходимо, чтобы между этими двумя компонентами наблюдался баланс, что особенно сложно сделать для обратной модели.
"Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В задачах с большой степенью неизвестности обратная модель - лишь вспомогательный инструмент, улучшающий результаты прямой модели. Мы искали способ сделать работу обратной модели гибкой и, наконец, смогли его получить", - пояснил стажер-исследователь Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев, чьи слова приводит пресс-служба вуза.
Этот подход, как считают ученые, позволит повысить эффективность обучения генеративных потоковых сетей в большом числе областей науки и экономики, в том числе в фармацевтике, материаловедении и при настройке больших языковых моделей. Его применение позволит быстро находить наиболее оптимальные варианты и заметно сократит нагрузку на вычислительные мощности, подытожили исследователи.