ТАСС, 15 декабря. Российские биоинформатики создали нейросетевой алгоритм, который может распознавать фрагменты так называемой Z-ДНК – участки ее спирали, которые закручены не вправо, а влево. Их "перепись" в геноме человека поможет узнать их роль в жизни клеток, пишет пресс-служба НИУ ВШЭ. Результаты исследования опубликовал научный журнал Scientific Reports.
Геном человека и всех остальных многоклеточных животных представляет собой набор из нескольких хромосом – длинных нитей ДНК, которые упакованы внутри ядра клетки. Долгое время биологи считали, что все молекулы ДНК – это спирали, закрученные вправо. Однако еще в конце прошлого века анализ трехмерной структуры генома показал, что это правило соблюдается далеко не всегда.
В частности, некоторые участки хромосом оказались закручены влево. Для подобных сегментов геном биологи стали использовать термин Z-ДНК. Те части хромосом, которые закручены вправо, начали называть B-ДНК. В последние годы Z-ДНК начала привлекать много внимания со стороны ученых, так как она может быть связана с некоторыми опасными заболеваниями, такими как рак, диабет и болезнь Альцгеймера.
Изучение функций левозакрученной ДНК осложняется тем, что у ученых пока нет точных представлений о том, как часто подобные сегменты встречаются внутри хромосом, что управляет их формированием и как может меняться их структура с течением времени. Это связано как с большими размерами генома, так и со сложностями в поиске участков Z-ДНК.
Российские биоинформатики придумали, как упростить эту задачу с помощью нейросетей. Для их тренировки ученые использовали не только сведения об уже известных участках Z-ДНК, но и информацию о том, как регулируется активность генов и синтез белков в клетках.
Сперва исследователи работали с двумя разными типами нейросетей: сверточными и реккурентными. Исследователи пытались понять, какие из них лучше подходят для решения этой задачи. Первые обычно используют для анализа изображений, а вторые – в распознавании рукописного текста и речи. Разработав полтора десятка моделей на их основе, ученые сравнили качество их работы и выяснили, что для поиска Z-ДНК лучше всего подходят рекуррентные.
Самую эффективную модель на основе этого типа нейросетей ученые использовали, чтобы предсказать, где могут находиться еще неизвестные участки Z-ДНК в геноме человека. Биоинформатики надеются, что в ближайшее время они смогут проверить предсказания и использовать подобные данные для изучения той роли, которую Z-ДНК играет в работе организма.