URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 134076
[ Назад ]

Исходное сообщение
"Обновление голосовых данных Mozilla Common Voice 18.0"

Отправлено opennews , 23-Июн-24 00:51 
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился с 31.1 до 31.8 тысяч часов речи, из которых 20.8 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 124 до 129 (добавлены языки африканских племён коса, календжин, кидавида, долуо и тсвана)...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=61422


Содержание

Сообщения в этом обсуждении
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Константавр , 23-Июн-24 00:51 
>русского языка - 3241 участник и 277 часов

Что-то мало. Чувствуется, что указа свыше небыло.


"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 23-Июн-24 09:37 
Для русского уже есть отличные модели распознавания речи. Поэтому мало интереса к развитию новых. А вот для разных малых языков пока потребность в датасетах и моделях есть.

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 23-Июн-24 13:52 
Английский очень малый язык.

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 23-Июн-24 18:13 
> Английский очень малый язык.

Интересно, а шотландцы понимают ямайцев?


"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Васян из васяна , 23-Июн-24 17:09 
какие?

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 23-Июн-24 18:12 
> какие?

https://alphacephei.com/nsh/2024/04/14/russian-models.html


"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:20 
это все про распознавание, а как с синтезом?

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:22 
внезапно, лучшая моделька с этой страницы натренирована на Common Voice

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:32 
(окей, внезапно ещё и на своем новом открытом датасете)

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:19 
модели "есть", все среднего качества кроме закрытых коммерческих (например, яндексовых или тинькова), а открытых качественных датасетов - нет

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:33 
(ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)

"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 25-Июн-24 19:41 
> (ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)

А ведь есть еще VK, ЦРТ, Наносемантика, Silero, МТС. Так еще и многие иностранные системы ASR поддерживают русский.


"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Бывалый Смузихлёб , 26-Июн-24 15:38 
сбер, яндекс.. да тот же билайн - раскалёнными кочергами по голым задам хреначить надо за их "успехи". Те проблемы, что ещё 10-15 лет назад решались за 0,5-1мин с оператором - нынче решаются за 10-15-30 мин с "ИИ" и огромной горой потраченных нервов
За подобное уже надо бы вводить статью

"предлагаю вам ознакомиться со справкой.. "( а с хрена ли тогда звонок, если "справка" его не покрывает и надо решить лично !? )