
«Сипуха» разоблачит голосовые дипфейки
Группой сотрудников и студентов кафедры криптологии и кибербезопасности НИЯУ МИФИ под руководством кандидата технических наук, доцента Дмитрия Ефанова разработана интеллектуальная система, способная оценить запись человеческого голоса – не является ли она голосовым дипфейком. Проект стал победителем на Конкурсе Мэра Москвы среди инновационных проектов для лучших предпринимателей, учёных и изобретателей столицы «Новатор Москвы». Разработанный продукт получил название «Сипуха» - в честь ночной птицы, отличающейся особенно острым слухом.
Как рассказал Дмитрий Ефанов, в основе системе лежит нейросеть, обученная различать дипфейки. В качестве данных для обучения нейросети использовалось более 200 тыс. записей человеческих голосов, среди которых были как подлинные записи, так и дипфейки, сгенерированные различными алгоритмами. Выявление дипфейков происходит благодаря анализу так называемых кепстральных коэффициентов – так специалисты по акустике называют некоторые важнейшие математические характеристики аудиосигналов, обычно рассчитываемые для коротких фрагментов аудиозаписей длительностью от 20 до 40 микросекунд.
Дмитрий Ефанов
По словам ученого, работа над данной системой началась в 2022 году, и тогда это была чисто академическая задача, поскольку подделка голосов в это время требовала больших ресурсов и не была распространена. На первом этапе поддержку проекта оказал Фонд содействия развитию малых форм предприятий в научно-технической сфере (Фонд содействия инновациям).
Однако, к 2024 году технологии подделки голоса стали гораздо доступнее и получили большое распространение – в частности, стали широко использоваться мошенниками. Таким образом, у первоначально научной разработки появились перспективы прикладного использования. Группа Дмитрия Ефанова участвовала в Технологическом акселераторе МИФИ и Госкорпорации «Росатом» - «Сипуха» стала одним из 4 финалистов акселератора (из первоначальных 60 заявок).
Сипуха обладает особенно острым слухом благодаря особой форме лицевого оперения и асимметрично расположенным ушам
Дмитрий Ефанов подчеркивает, что сегодня задачей разработчиков «Сипухи» является создание облачного сервиса, который позволит легко и быстро подключать функцию распознания дипфейков к любой нуждающейся в этом публичной или коммерческой системе коммуникации – например к колл-центру или мессенджеру. Заинтересованность в использовании сервиса уже подтвердили такие известные российские компании, как «ТБанк» и «Информзащита». В перспективе также необходимо создание исследовательской лаборатории, в которой на регулярной основе будет совершенствоваться нейронная сеть - ведь постоянно появляются новые алгоритмы синтеза дипфейков.
Ученые надеются, что проект получит поддержку со стороны соответствующих структур Правительства Москвы.