ТАСС, 19 сентября. Российские и зарубежные ученые разработали платформу Shambhala, которая позволяет объединять большие данные (big data) по уровню активности множества генов. Создание этой базы позволит ученым объединить плохо совместимые данные разных экспериментов, сообщила пресс-служба МФТИ. Работа была опубликована в журнале Frontiers in Molecular Biosciences.
"Уже давно ученые бьются над тем, чтобы профили генной экспрессии были сравнимы друг с другом. Мы создали электронную платформу Shambhala, которая преобразует каждый профиль генной экспрессии в заранее определенный универсальный формат. Таким образом, все данные объединяются в единую матрицу, части которой можно как угодно сравнивать между собой", - заявил заведующий лабораторией биоинформатики МФТИ Антон Буздин, чьи слова приводит пресс-служба вуза.
Как отмечают Буздин и его коллеги, за последние несколько десятилетий биологи создали большое число подходов, позволяющих измерять активность генов и отслеживать проявления их работы в жизнедеятельности клеток. Чаще всего для этих целей применяются два подхода: микрочиповая гибридизация и РНК-секвенирование, результаты которых слабо совместимы друг с другом. Это ограничивает возможности ученых по использованию больших данных в геномных исследованиях.
Для решения этой проблемы российские ученые и их коллеги из США, Турции и Европы разработали платформу Shambhala, которая позволяет гармонизировать разнородные данные и при этом учесть все ключевые биологические особенности, связанные с работой изучаемых генов. Для создания платформы ученые применили алгоритм CuBlock, основанный на том, что большинство генов, чья работа была изучена двумя разными методиками, обладают "средним" уровнем активности.
Работу платформы исследователи проверили на шести наборах данных с информацией об уровне активности генов в примерно 6,8 тыс. образцах опухолей и 11,1 тыс. здоровых тканях тела человека. Результаты работы Shambhala ученые сравнили с тремя другими подходами по гармонизации результатов геномных исследований и пришли к выводу, что созданный ими подход превосходит конкурентов по многим параметрам.
"Практическое применение платформы лежит в сфере анализа больших данных. Анализ генной экспрессии позволит нам научиться лечить многие хронические заболевания, в том числе онкологические, и различные инфекции, включая новые. Понять причину и механизм их появления и развития, а значит, и определить, какие лекарства наиболее эффективно подходят в каждом конкретном случае. Также эти данные помогут в разработке вакцин нового поколения", - отметил Буздин.