МОСКВА, 5 апреля. /ТАСС/. Исследователи из России и зарубежных стран выяснили, что нейросеть AlphaFold от компании Deepmind не способна корректно оценивать последствия появления точечных мутаций в структуре белков. Это ставит под сомнение то, что система действительно "понимает" строение белковых молекул, сообщила в среду пресс-служба "Сколтеха".
"Мы решили проверить, предскажет ли AlphaFold изменения в стабильности белка вследствие появления одиночной мутации. То есть вы берете некоторый известный белок, вносите в него минимально возможное изменение и хотите знать, полученный мутант будет стабильнее или нестабильнее и насколько. С этой задачей AlphaFold не справился: предсказания никак не согласуются с известными экспериментальными данными", - объяснил старший преподаватель "Сколтеха" Дмитрий Иванков, чьи слова приводит пресс-служба вуза.
Нейросеть AlphaFold разработана британской компании DeepMind, она должна решать одну из самых сложных задач в биологии - определять трехмерную форму белковых молекул, зная только их химический состав. Как показали первые опыты, она способна определять положение аминокислот внутри молекулы с атомной точностью.
Большие успехи AlphaFold в решении этой задачи, как отмечает Иванков, заставили некоторых ученых предполагать, что нейросеть "понимает" физические и химические законы, которые задают трехмерную форму белков. Исследователи решили проверить, так ли это на самом деле. Для этого они попытались применить AlphaFold для решения похожей задачи - оценки стабильности белковой молекулы при появлении в ней точечной мутации.
Ошибки в работе нейросети
"Наше исследование выросло из "игрушечного" проекта с участниками сколтеховской Школы молекулярной и теоретической биологии. Проект так и назывался: "Игры с AlphaFold". Как только AlphaFold был выложен в открытый доступ, мы установили его на сколтеховский суперкомпьютер "Жорес". Одна из игр заключалась в сопоставлении эффекта мутации с предсказаниями AlphaFold для структуры исходного и мутантного белка", - пояснила аспирант "Сколтеха" Марина Пак, чьи слова приводит пресс-служба вуза.
В ходе расчетов свойств мутантных белков, которые ученые проводили совместно со школьниками, исследователи обнаружили, что многие результаты работы AlphaFold сильно расходились с экспериментальными замерами стабильности и других свойств этих же самых пептидов. Это натолкнуло их на мысль, что нейросеть совершает ошибки при работе с такими белками.
По этой причине, ученые просчитали при помощи AlphaFold изменения в стабильности структуры флуоресцентного белка GFP при появлении нескольких сотен различных точечных мутаций в его структуре. Эти результаты расчетов исследователи сравнили с тем, как менялась сила свечения GFP при появлении этих мутаций, каждая из которых была изучена экспериментальным путем.
Как оказалось, AlphaFold корректно предугадывал эти изменения лишь в небольшом числе случаев, что не позволяет использовать нейросеть для решения этих задач. Кроме того, эти ошибки в работе нейросети говорят в пользу того, что она просто запоминает и воспроизводит определенные структурные элементы белков, а не пользуется законами физики и химии для определения формы молекул, подытожили исследователи.