МОСКВА, 28 августа. /ТАСС/. Специалисты Санкт-Петербургского Федерального исследовательского центра РАН (СПб ФИЦ РАН) при поддержке гранта Российского научного фонда разработали систему с применением искусственного интеллекта, распознающую человеческие эмоции по видео и звуку, сообщили в пресс-службе Минобрнауки РФ. Разработка, по мысли ее авторов, может пригодиться для совершенствования цифровых помощников человека.
"Исследователи СПб ФИЦ РАН создали интеллектуальную программную систему MASAI, которая включает в себя комплекс нейросетей, способных распознавать естественные эмоции и сентимент человека по аудиовизуальной информации (видео, звук и текст). Точность распознавания эмоций превосходит существующие аналоги и достигает 80%. В перспективе разработка позволит создавать более эффективные цифровые помощники, работающие на принципах эмоционального искусственного интеллекта", - отметили в пресс-службе.
Ученые полагают одной из задач дальнейшего внедрения ИИ-сервисов в жизнь человека - научить искусственный интеллект распознавать весь спектр разнородной информации: речь, мимику, жесты, взгляд, поведение, а также текстовую информацию. Подобные системы смогут работать даже в сложных условиях шума, плохого освещения или когда человек просто молчит или не смотрит в камеру. Более того, ИИ-сервисы смогут распознавать даже сарказм или иронию, когда смысл сказанного не совпадает с интонацией или выражением лица.
Разработка представляет собой программное приложение, через интерфейс которого можно загрузить и обработать любые аудиовизуальные данные. Программа может распознавать семь базовых человеческих эмоций: радость, грусть, страх, отвращение, удивление, злость и спокойствие, а также положительный, отрицательный и нейтральный сентименты.
В основе системы несколько нейронных сетей, которые прошли обучение на десятках баз данных в свободном доступе, содержащих многоязычную аудиовизуальную информацию о людях разного возраста и пола из различных стран мира. В создании базы данных на русском языке принимали участие молодые актеры театральных вузов.
"Система MASAI может быть встроена в различные виды цифровых помощников, которые сейчас используются во многих сферах жизни человека. Например, в телефонных службах скорой помощи или психологической поддержки, где эмоциональный искусственный интеллект позволит эффективнее реагировать на потребности человека", - рассказал руководитель лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Алексей Карпов.