Разработана методика по созданию датасета для нейросетей
Разработчики назвали универсальность основным преимуществом инструкций
ВЕЛИКИЙ НОВГОРОД, 2 июля. /ТАСС/. Методику по созданию датасета для неросетей разработали в Новгородском государственном университете имени Ярослава Мудрого. Это набор практических инструкций и рекомендаций, с помощью которых можно будет обучить нейросети распознавать эмоции по голосу, сообщил ТАСС один из авторов инструкций Владислав Билев.
"Чтобы программа правильно обучилась этому, ей нужна четко структурированная база данных, которой она будет оперировать. Сейчас, в "бум" нейросетей, многие энтузиасты делают хорошие продукты в сфере ИИ и распознавания. Однако допускают ошибки на стадии формирования датасета для таких программ. Ведь в этом деле много нюансов: технических, как соблюсти разные требования к исходным файлам, чтобы сеть верно по ним обучилась, финансовых - можно ли сэкономить при сборе данных из разных источников, юридических - как соблюсти авторские права, обеспечить конфиденциальность данных и так далее. Разработанные нами инструкции помогут избежать этих проблем и повысить качество разработок в сфере распознавания эмоций по голосу", - сказал Билев.
По его словам, инструкции будут полезны разработчикам русскоязычных программ и уже используются в качестве обучающих пособий в университете. Как отметили разработчики, основное преимущество их методических материалов в том, что они универсальны.
"С помощью наших методичек можно разработать датасет под конкретные запросы. Например, для узкоспециализированных программ по распознаванию эмоций у людей с дефектами речи. Или, напротив, максимально объемный датасет для улучшения работы голосовых помощников. Это очень удобно, так как из готовых датасетов, что сейчас представлены на рынке, большинство представлено либо на зарубежных языках, либо имеют какие-то недоработки", - добавил Билев, отметив, что обзор разработки удалось сделать при грантовой поддержке Минобрнауки.