• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Нейросети могут давать настолько же точные оценки, как и человек»

«Нейросети могут давать настолько же точные оценки, как и человек»

© Высшая школа экономики

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.

Никита Шевцов

«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.

Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.

На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.

«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.

Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.

«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.

Вам также может быть интересно:

ВШЭ ищет новые идеи для ИИ-агентов: стартовал конкурс инициатив

Высшая школа экономики приглашает исследователей и преподавателей представить концепции новых цифровых продуктов на базе искусственного интеллекта. Лучшие проекты получат экспертную и технологическую поддержку. Заявки принимаются до 19 декабря.

В Вышке создан Институт робототехнических систем

Решение об этом принял Ученый совет НИУ ВШЭ. У нового института будет мощная фундаментальная база, он будет сотрудничать с другими профильными подразделениями, вовлекать студентов и аспирантов в исследования и разработки. К каким практическим результатам приведет работа института и как планируется организовать взаимодействие с его индустриальным партнером, «Вышке.Главное» рассказал первый проректор НИУ ВШЭ, директор Института статистических исследований и экономики знаний Леонид Гохберг.

Подведены итоги Конкурса инноваций в образовании — 2025

22 ноября в конгресс-холле Альфа-Банка состоялась церемония награждения финалистов, победителей в номинациях и абсолютного победителя Конкурса инноваций в образовании (КИвО-2025). Он проводится 12-й раз, и сегодня это хорошо известный в образовательном сообществе флагманский проект Высшей школы экономики, объединяющий формальное образование, EdTech и частные инициативы.

От импортозамещения к прорыву: как Россия движется к технологическому суверенитету

Доля импорта в затратах на производство и реализацию продукции в России сократилась почти в два раза с 2021 по 2024 год. Об этом свидетельствуют данные исследования НИУ ВШЭ, представленные на круглом столе, посвященном технологическому суверенитету. Эксперты также обсудили, как перейти от импортозамещения в промышленности к прорыву на глобальных рынках. Мероприятие прошло в рамках Дискуссионного экспертного форума НИУ ВШЭ.

Вышка Онлайн представила документальный фильм о влиянии ИИ на нашу жизнь

27 ноября на всех онлайн-площадках Вышки Онлайн состоялась премьера документального фильма «После промпта» от онлайн-кампуса НИУ ВШЭ. Его авторы исследуют, как искусственный интеллект меняет работу, карьерные траектории и профессиональное развитие специалистов. Это первый видеопроект, полностью реализованный командой онлайн-кампуса НИУ ВШЭ совместно с приглашенным режиссером Ольгой Науменко.

«Показать науку через игру»: в Вышке состоялся фестиваль «Республика ученых»

В середине ноября в атриуме корпуса университета на Покровском бульваре при поддержке Центра академического развития студентов прошел Фестиваль науки НИУ ВШЭ «Республика ученых». Событие помогло студентам познакомиться с различными объединениями исследователей Вышки. В этом году в празднике приняли участие Центр научной интеграции и Центр академического письма, а также студенческие организации, которые представили свою деятельность через интерактивные форматы.

В Национальном форуме ДПО приняли участие свыше 3 тысяч человек

В Высшей школе экономики 20–21 ноября состоялся Национальный форум ДПО. В его работе приняли участие представители вузов, государства, бизнеса, ведущие эксперты в сфере образования и HR. Мероприятия, проходившие в комплексе НИУ ВШЭ в Москве на Покровском бульваре, посетили более 800 человек, а общее число офлайн- и онлайн–участников превысило 3 тысячи.

Ученые обнаружили один из самых долгих случаев ковида

Международная группа исследователей при участии ученых из НИУ ВШЭ изучила необычный образец вируса SARS-CoV-2 у ВИЧ-положительной пациентки. Генетический анализ позволил выявить множественные мутации и установить, что вирус эволюционировал в организме на протяжении 2 лет. Это подтверждает теорию о том, что вирус способен годами оставаться в организме отдельных людей, постепенно накапливать мутации и затем выплескиваться в популяцию. Результаты опубликованы в журнале Frontiers in Cellular and Infection Microbiology.

Восьмой международный онлайн-семинар U4U объединил экспертов из 14 стран

Онлайн-кампус НИУ ВШЭ провел двухдневный международный семинар U4U (Universities for Universities), который традиционно служит площадкой для обмена опытом между университетами в области онлайн-обучения. В этом году событие вышло на глобальный уровень и расширило географию. К обсуждению ключевых вызовов и стратегий развития онлайн-образования присоединились международные эксперты и представители университетов со всего мира. Встреча состоялась в онлайн-формате в середине ноября.

Технологический прорыв: исследования Института ИИ и цифровых наук отмечены на AI Journey 2025

Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭ в рамках Международной конференции AI Journey 2025 представили передовые ИИ-исследования с высоким уровнем научной новизны и практической применимости. Научное решение заведующего Научно-учебной лабораторией матричных и тензорных методов в машинном обучении Максима Рахубы получило премию «Лидеры ИИ — 2025». Заведующий Центром глубинного обучения и байесовских методов Айбек Аланов — среди финалистов премии.