Все новости

Российские ученые создали платформу интеллектуального анализа больших текстовых массивов

Платформа способна не только анализировать большие объемы научно-технической информации, но и исследовать социальные сети на предмет нежелательного контента и признаков нестандартного поведения пользователей

МОСКВА, 14 апреля. /ТАСС/. Группа российских исследователей, в которую вошли специалисты Центра компетенций НТИ по направлению "Технологии хранения и анализа больших данных" на базе МГУ имени М. В. Ломоносова, создала платформу для интеллектуального анализа текстов, которая повысит эффективность патентного и исследовательского поиска. Об этом во вторник сообщила пресс-служба Российской венчурной компании.

В создании технологического решения также участвовали ученые Института проблем искусственного интеллекта ФИЦ "Информатика и управление" РАН и разработчики компании "Технологии системного анализа". Проект стал первым в мире промышленным решением, обладающим возможностями кросс-языковой аналитики, сообщает РВК.

"Разработанное решение может анализировать и обрабатывать любой тип информации, представленной в текстовом виде на русском, английском, белорусском, казахском и татарском и языках. Преимуществом проекта является возможность кросс-языковой аналитики текстов: не требуется повторный поиск одних и тех же сведений, представленных в документах на разных языках и описанных терминами из разных языков. Внедрение решения существенно упростит работу специалистов, работающих с анализом больших объемов текстов, и значительно повысит эффективность патентного и исследовательского поиска", - говорится в сообщении.

Платформа способна не только анализировать большие объемы научно-технической информации, но и исследовать социальные сети на предмет нежелательного контента и признаков нестандартного поведения пользователей. Решение может выполнять задачи по анализу медицинских документов, технической информации по закупкам для перевода больших массивов текстов в форму структурированной информации, считают авторы. Потребителями разработки могут стать аналитические центры, научные и научно-образовательные организации, предприятия, оказывающие услуги защиты интеллектуальной собственности и государственные корпорации.

"Симбиоз нескольких научных подходов, предложенный президентом Российской академии социальных наук, доктором философских наук, профессором Геннадием Осиповым, позволяет описывать тематику документов через словосочетания и анализировать смысл, отдельных высказываний в форме неоднородных семантических сетей. В совокупности с современными методами компьютерной лингвистики, дистрибутивной семантики и машинного обучения созданное решение позволяет достигать большей точности и полноты в задачах текстовой аналитики", - считает руководитель проекта, научный сотрудник Центра компетенций НТИ на базе МГУ по направлению "Технологии хранения и анализа больших данных" Илья Соченков, чьи слова приводятся в сообщении.

Решение уже прошло стадию пилотных внедрений в ряде организаций.

НТИ

Центр компетенций НТИ по направлению "Технологии хранения и анализа больших данных" на базе МГУ является одним из 14 центров компетенций Национальной технологической инициативы, занимается вопросами развития биотехнологий. Каждый из центров объединяет университеты, исследовательские центры и инновационные предприятия для создания сквозных технологий, которые будут востребованы на новых глобальных рынках через 15-20 лет. Оператором проекта создания Центров компетенций НТИ является Российская венчурная компания (РВК).