Все новости

Нейросеть от Deepmind научили определять форму белковых молекул

Алгоритм AlphaFold2 может с атомной точнотсью реконструировать трехмерную форму белков за несколько десятков белков

ТАСС, 15 июля. Специалисты компании Deepmind приспособили разработанные ими нейросети, чтобы предсказывать, какая трехмерная форма будет у той или иной белковой молекулы. зная лишь то, из каких аминокислот она состоит. Выводы ученых были опубликованы в статье в журнале Nature.

"В прошлом году мы уже представили первую версию нашей системы, AlphaFold, которая смогла с почти атомной точностью предсказывать структуру белков в рамках конкурса CASP13. Сейчас мы создали новую ее версию, которая заметно превосходит всех конкурентов в скорости и точности работы. При этом ее исходный код полностью открыт", – отметил генеральный директор Deepmind Демис Хассабис.

Пять лет назад ученые под руководством сооснователя DeepMind Дэвида Сильвера разработали AlphaGo – первую нейросеть, которая выиграла человека в го – игре, которую раньше считали слишком сложной для компьютеров. Следующие версии этой системы научились обучаться без участия человека, а также освоили некоторые другие – например, шутер Quake III Arena или Starcraft II.

В новой работе Сильвер и его коллеги приспособили свою нейросеть для решения гораздо более сложной и практически значимой задачи – определения, какую форму примет та или иная белковая молекула, по последовательности аминокислот, из которых она состоит. 

Понимание структуры белков крайне важно для создания лекарств, однако пока нет простого и быстрого способа решить эту задачу. Для этого используют или ускорители частиц, с помощью которых можно получить трехмерные "фотографии" белковых молекул, или суперкомпьютеры, которые просчитывают их структуру в соответствии с законами химии и квантовой физики.
 
Искусственный интеллект уже давно пытаются приспособить для решения этой задачи. До недавнего времени нейросетевые алгоритмы уступали всем классическим, с помощью которых подобные расчеты можно проводить с помощью суперкомпьютеров или системы распределенных вычислений.

Сильвер и его коллеги решили эту проблему. Они создали новый тип нейросетей – "эвоформер". Такой алгоритм пытается определить структуру отдельных сегментов белковых молекул, представляя их в виде трехмерного дерева графов – математической абстракции, которая состоит из набора объектов, попарно связанных друг с другом. Эвоформер соединяет их друг с другом, опираясь на уже известные примеры, и постепенно меняет структуру связей и расположение узлов, приближаясь к оптимуму.

Объединив несколько десятков "эвоформеров" друг с другом, специалисты Deepmind создали нейросеть AlphaFold2, которая заметно превосходила все существующие попытки решить эту задачу при помощи нейросетей, в том числе систему AlphaFold, созданную Сильвером и его коллегами в прошлом году и работающую по иным принципам.

Испытания на разных наборах белков, в том числе молекуле Orf8, одном из компонентов коронавируса SARS-CoV-2, показали эффективность нового алгоритма: нейросеть всего за несколько десятков минут работы реконструировала их трехмерную форму с атомной точностью. В среднем она определяла положение каждого атома внутри белка с погрешностью в 0,096 нанометра, меньше трети диаметра атома углерода. Это в несколько раз меньше, чем удавалось добиться в прошлом ее конкурентам.

Ученые надеются, что после того, как они раскроют исходный код AlphaFold2, изучение свойств всех белков, присутствующих в организме человека или вырабатываемых бактериями и вирусами, резко ускорится. Это приблизит человечество к созданию новых лекарств от различных болезней и инфекций, подытожили исследователи.