Создан инструмент для защиты голосовых данных от создания дипфейков

Главная цель - усилить методологию защиты "цифрового следа" людей в публичном пространстве, указали в пресс-службе Института искусственного интеллекта AIRI

МОСКВА, 26 июня. /ТАСС/. Российские исследователи разработали и выложили в открытый доступ алгоритм защиты персональных голосовых данных, позволяющий защищать подкасты, интервью, потоковые трансляции и прочие типы аудиозаписей от несанкционированного сбора биометрии и анализа при помощи ИИ. Об этом сообщила пресс-служба Института искусственного интеллекта AIRI.

"Наша цель - усилить методологию защиты "цифрового следа" людей в публичном пространстве. В первую очередь - их голосовой идентичности. Разработанное решение позволяет свободно делиться аудиоконтентом, значительно снижая вероятность того, что голос станет сырьем для несанкционированного сбора биометрических данных или создания дипфейков" - отметил руководитель Лаборатории безопасного ИИ AIRI-МТУСИ Олег Рогов, чьи слова приводит пресс-служба AIRI.

Как отмечают ученые, сейчас в глобальной сети присутствует огромный набор публично доступных аудиозаписей, которые злоумышленники или недобросовестные компании могут использовать для автоматического сбора голосовых биометрических данных и подготовки на их базе различных дипфейков. Особенно сильно это угрожает публичным лицам и контент-мейкерам, чьи выступления легко можно найти в интернете.

Для борьбы с этой проблемой за последние годы разработчики создали несколько систем "анонимизации" голосов, большинство из которых значительным образом ухудшают качество аудиозаписи, а также далеко не всегда эффективно работают с аудиозаписями короткой или большой длины. Исследователи разработали лишенный этих недостатков алгоритм, который использует в своей работе математические подходы, ранее применявшиеся в визуальном анализе.

Как отмечается в сообщении, использование этих подходов позволяет одновременно максимально "обезличивать" аудиоданные и минимальным образом влиять на воспринимаемое качество звука, его разборчивость для слушателей и совместимость подобных записей с ИИ-системами распознавания содержания речи. Представленное решение работает на аудиофайлах любой длины от коротких цитат до длинных лекций.

Работу этого алгоритма исследователи проверили на популярном наборе аудиозаписей голосов знаменитостей (VoxCeleb2), который часто используется при разработке голосовых систем ИИ и подготовке дипфейков. Эти опыты подтвердили, что новый подход позволяет столь же успешно защитить данные, как это делают уже существующие подходы, и при этом оставить качество звука на высоком уровне. Как надеются ученые, их разработка поможет владельцам онлайн-площадок защитить аудиоданные пользователей от несанкционированного сбора биометрии.