6 ФЕВ, 13:46

В России создали нейросеть для поиска новых трендов в наборах данных

Подход позволит предугадывать начало землетрясений, эпидемий и многих других событий, отметили в пресс-службе НИУ ВШЭ

МОСКВА, 6 февраля. /ТАСС/. Российские ученые разработали нейросетевой алгоритм, позволяющий эффективно искать новые тренды в так называемых временных рядах, наборах связанных друг с другом величин, которые меняются с течением времени. Этот подход позволит предугадывать начало землетрясений, эпидемий и многих других событий, сообщила во вторник пресс-служба НИУ ВШЭ.

"Исследователи представили новый алгоритм обнаружения структурных изменений во временных рядах. Метод использует нейронную сеть для сравнения различных отрезков ряда, что позволяет быстрее выявлять изменения в его поведении. Алгоритм показал многообещающие результаты - он обнаруживает важные события или изменения в данных в среднем на 30% быстрее конкурентов", - говорится в сообщении.

Данный алгоритм был разработан научными сотрудниками НИУ ВШЭ Никитой Пучкиным и Валерией Щербаковой для поиска разладок. Так математики называют особые точки во временных рядах, в которых собранные данные перестают соответствовать ожидаемому тренду или образцу. Поиски разладок играют ключевую роль в определении новых трендов и закономерностей при анализе различных событий, в том числе пандемий и землетрясений, однако они часто бывают не заметны глазу человека.

"В основе нашего алгоритма лежит простая идея: раз поведение временного ряда изменилось, наблюдения до и после момента разладки можно отличить друг от друга. Для этого мы используем нейронную сеть, оптимизируя ее таким образом, чтобы контрастность между частями выборки до и после разладки была наиболее ярко выражена. Поэтому метод получился универсальным, а главное, эффективность его работы подтверждается математически", - пояснил Пучкин, чьи слова приводит пресс-служба вуза.

Используя этот подход, ученые попытались выявить тренды в нескольких синтетических наборах данных, а также в реальных записях речи человека, которые были в разной степени зашумлены. Аналогичные временные ряды были также проанализированы при помощи нескольких популярных алгоритмов, использующих иные подходы для выявления разладок в наборах данных.

Проведенные исследователями расчеты показали, что их разработка в целом не уступала конкурентам при анализе разных типов временных рядов, и при этом она выявляла важные события или изменения в данных в среднем на 30% быстрее конкурентов. Это говорит в пользу того, что внедрение разработки российских ученых в системы анализа данных значительно ускорит и улучшит их работу.

Читать на tass.ru
Теги