Российские учёные открыли доступ к инновационной технологии защиты голосовой биометрии от автоматизированного сбора и анализа. Проект разработан специалистами AIRI (Институт искусственного интеллекта), МТУСИ, «Сбера» и VeinCV.
В его основе – универсальные состязательные патчи (UAP), которые накладываются на аудиофайл перед публикацией. Они эффективно блокируют алгоритмы, предназначенные для извлечения биометрических голосовых данных, но при этом не искажают звучание и не мешают восприятию речи человеком.
С каждым днём вопросы защиты голосовой идентичности становятся всё более актуальными: нейросети, способные синтезировать речь, всё чаще применяются для создания дипфейков без согласия оригинального говорящего. Здесь UAP выступают надёжным барьером: технология оставляет аудио разборчивым и пригодным для транскрипции, перевода или поиска, но делает невозможным автоматическую идентификацию личности.
Протестированная на базе знаменитого набора VoxCeleb2, технология доказала свою эффективность: уникальные голосовые признаки становятся недоступными алгоритмам, а качество записи остаётся на высоком уровне.
Ключевые преимущества метода:
Научный вес разработки подтверждён её отбором для презентации на престижной международной конференции Interspeech 2025 в Роттердаме (конференция входит в рейтинг Core‑A). Полный текст исследования опубликован на arXiv – arxiv.org/pdf/2505.19951.
В его основе – универсальные состязательные патчи (UAP), которые накладываются на аудиофайл перед публикацией. Они эффективно блокируют алгоритмы, предназначенные для извлечения биометрических голосовых данных, но при этом не искажают звучание и не мешают восприятию речи человеком.
С каждым днём вопросы защиты голосовой идентичности становятся всё более актуальными: нейросети, способные синтезировать речь, всё чаще применяются для создания дипфейков без согласия оригинального говорящего. Здесь UAP выступают надёжным барьером: технология оставляет аудио разборчивым и пригодным для транскрипции, перевода или поиска, но делает невозможным автоматическую идентификацию личности.
Протестированная на базе знаменитого набора VoxCeleb2, технология доказала свою эффективность: уникальные голосовые признаки становятся недоступными алгоритмам, а качество записи остаётся на высоком уровне.
Ключевые преимущества метода:
- Защищённые голосовые записи сохраняют естественность и чистоту звука для слушателя.
- Универсальность: подходит для файлов любой длительности — от коротких заметок до длинных лекций .
- Может быть интегрирована в образовательные платформы, вебинары, интервью, подкасты и другие публичные аудиоканалы.
Научный вес разработки подтверждён её отбором для презентации на престижной международной конференции Interspeech 2025 в Роттердаме (конференция входит в рейтинг Core‑A). Полный текст исследования опубликован на arXiv – arxiv.org/pdf/2505.19951.
Задать вопрос нашим экспертам: Группа компаний "Паладин"