URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 134076
[ Назад ]
Исходное сообщение
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено opennews , 23-Июн-24 00:51
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 31.1 до 31.8 тысяч часов речи, из которых 20.8 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 124 до 129 (добавлены языки африканских племён коса, календжин, кидавида, долуо и тсвана)...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=61422
Содержание
- Обновление голосовых данных Mozilla Common Voice 18.0,Константавр, 00:51 , 23-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Анонус, 09:37 , 23-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Аноним, 13:52 , 23-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Анонус, 18:13 , 23-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Васян из васяна, 17:09 , 23-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Анонус, 18:12 , 23-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Аноним, 18:20 , 25-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Аноним, 18:22 , 25-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Аноним, 18:32 , 25-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Аноним, 18:19 , 25-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Аноним, 18:33 , 25-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Анонус, 19:41 , 25-Июн-24
- Обновление голосовых данных Mozilla Common Voice 18.0,Бывалый Смузихлёб, 15:38 , 26-Июн-24
Сообщения в этом обсуждении
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Константавр , 23-Июн-24 00:51
>русского языка - 3241 участник и 277 часовЧто-то мало. Чувствуется, что указа свыше небыло.
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 23-Июн-24 09:37
Для русского уже есть отличные модели распознавания речи. Поэтому мало интереса к развитию новых. А вот для разных малых языков пока потребность в датасетах и моделях есть.
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 23-Июн-24 13:52
Английский очень малый язык.
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 23-Июн-24 18:13
> Английский очень малый язык.Интересно, а шотландцы понимают ямайцев?
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Васян из васяна , 23-Июн-24 17:09
какие?
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 23-Июн-24 18:12
> какие?https://alphacephei.com/nsh/2024/04/14/russian-models.html
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:20
это все про распознавание, а как с синтезом?
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:22
внезапно, лучшая моделька с этой страницы натренирована на Common Voice
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:32
(окей, внезапно ещё и на своем новом открытом датасете)
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:19
модели "есть", все среднего качества кроме закрытых коммерческих (например, яндексовых или тинькова), а открытых качественных датасетов - нет
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Аноним , 25-Июн-24 18:33
(ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Анонус , 25-Июн-24 19:41
> (ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса) А ведь есть еще VK, ЦРТ, Наносемантика, Silero, МТС. Так еще и многие иностранные системы ASR поддерживают русский.
"Обновление голосовых данных Mozilla Common Voice 18.0"
Отправлено Бывалый Смузихлёб , 26-Июн-24 15:38
сбер, яндекс.. да тот же билайн - раскалёнными кочергами по голым задам хреначить надо за их "успехи". Те проблемы, что ещё 10-15 лет назад решались за 0,5-1мин с оператором - нынче решаются за 10-15-30 мин с "ИИ" и огромной горой потраченных нервов
За подобное уже надо бы вводить статью"предлагаю вам ознакомиться со справкой.. "( а с хрена ли тогда звонок, если "справка" его не покрывает и надо решить лично !? )