URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 131004
[ Назад ]

Исходное сообщение
"Обновление голосовых данных Mozilla Common Voice 14.0 "

Отправлено opennews , 17-Июл-23 08:54 
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился с 27.1 до 28.1 тысяч часов речи, из которых 18.6 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 108 до 112 (добавлены пушту, албанский, амхарский и стандартный марокканский берберский языки)...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=59451


Содержание

Сообщения в этом обсуждении
"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 08:54 
Очень странно, что у украинского языка так мало участников и так мало наговорено...

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 09:09 
В три с лишним раза население, чем в РФ. В три с лишним раза меньше участников и наговорено.
Ну и как бы не до того сейчас, страну защищать надо.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 09:11 
Для мазилы украинец всегда должен найти время.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Анонус , 17-Июл-23 10:25 
Беларусам это не помешало. Хотя я в одной из прошлых новостей объяснял почему так. Потому что для русского уже есть несколько качественных моделей/сервисов для распознавания и генерации. Поэтому никто особо проектом Мозиллы не интересуется. А вот для малых языков это актуально.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Анонус , 17-Июл-23 10:29 
Как подтверждение, среди 11 миллионов носителей каталанского языка нашлось аж 35 тысяч волонтеров. Для испанского при этом "всего" 25 тысяч.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 14:36 
Каталония освободится от Испании. 1930-х гг. диктатор Франко кровью подавил стремление катлонской нации к Свободе. В Шотладии тоже ненавидят Англичан, и индусов, которые называют себя Британцами.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 16:04 
Может кто-то и ненавидит, но большинство оказалось вполне адекватно, чтобы не устраивать ещё один брекзит, как будто просто брекзит не является уже большой проблемой (и за который проголосовало с небольшим перевесом, при таком соотношении вообще второй тур положен).

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Анонус , 17-Июл-23 16:41 
> Может кто-то и ненавидит, но большинство оказалось вполне адекватно, чтобы не устраивать
> ещё один брекзит, как будто просто брекзит не является уже большой
> проблемой (и за который проголосовало с небольшим перевесом, при таком соотношении
> вообще второй тур положен).

Вообще, насколько помню, многие шотландцы хотят отделиться от Англии, чтобы вернуться в ЕС. Так что это не "еще один Брекзит", а скорее "Еврентер".


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 11:33 
В Беларуси военные действия не ведутся.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Анонус , 17-Июл-23 11:46 
> Первый выпуск    2017 июня 19; 6 лет назад

Времени было достаточно. Там даже уйгуров (которые все как известно по концлагерм сидят) больше.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 13:35 
Если человек постоянно находит отмазки для всего, то это явный гражданин государства на юго-востоке европы. Прямо на лбу написано.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 16:05 
Греции что-ли?

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Тот_Самый_Анонимус__ , 17-Июл-23 16:14 
>Если человек постоянно находит отмазки для всего, то это явный гражданин государства на юго-востоке европы. Прямо на лбу написано.

Ну. может ему в принципе не упёрлось работать на ненужный ему язык, который его ещё и заставляют использовать.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено BeLord , 17-Июл-23 13:15 
Очень оптимистично, сомневаюсь 30% оставшихся владеют литературным украинским языком. Суржик стайл и галиция эдишн не предлагать-))

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено n00by , 17-Июл-23 09:25 
Они сразу на трёх языках наговаривают: английском и двух украинских.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 08:56 
Ещё странно, что на белорусском больше, чем на русском.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 12:22 
Батька сказал - наховорить! Они и наховорили. Всем участникам выписал благодарность: "Партыя табой ганарыцца, атрымлівай мяшок бульбы і трактар жонку."

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Joey , 17-Июл-23 13:01 
Тот, кто думает, будто Лукашенко поддерживает белорусский язык -- очень сильно заблуждается. Он делает максимум, чтобы русифицировать страну. Тут скорее "оппозиционно настроенные" белорусы потрудились.

PS: Если он вам батька -- забирайте :)


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 14:32 
>Лукашенко поддерживает белорусский язык -- очень сильно заблуждается. Он делает максимум, чтобы русифицировать страну.

Ну так ведь русские его же купили, ещё в 1990-х гг. Вроде люди Примакова постарались.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Тот_Самый_Анонимус__ , 17-Июл-23 16:17 
Правда? А может прочто этот «язык» не нужен населению? Австралийцыдаже заморачиваться не стали с придумыванием языка, и даже язык аборигенов не навязывают, а в Белоруссии — навязывают, хотя 95% на нём не говорит.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 18:04 
Правда. На официальном уровне продвигается русский язык, дублирование на белорусском чисто номинальное. Белорусский язык - язык оппозиции, как способ поддержания национальной идентичности, демонстративного отстранения от пророссийской власти. Если белорус говорит на белорусском, можешь быть на сто процентов уверен, что он противник Лукашенко.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Тот_Самый_Анонимус__ , 17-Июл-23 18:29 
Он не «продвигается»,а всегда был востребован, ибо язык большинства. Русский всегда был таким в Белоруссии.

>Белорусский язык - язык оппозиции, как способ поддержания национальной идентичности, демонстративного отстранения от пророссийской власти.

Ну т.е. вы сами признаёте что это просто способ выпендриться и показать свою «нетаковость». Это фактор политики, а не потребности общества и пользуются этим «языком» не простые люди, а либо идейные, либо проплаченные змагары.

>Если белорус говорит на белорусском, можешь быть на сто процентов уверен, что он противник Лукашенко.

Ещё один тезис в доказательство чуть выше сказанного. А то что Лука пользуется языком большинства говорит в его пользу.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 19:44 
>Он не «продвигается»,а всегда был востребован, ибо язык большинства.

Сказать, что "русский язык востребован" не правильно. Просто белорусы забыли родной язык, по привычке, с детства приучены русскому языку.

>Русский всегда был таким в Белоруссии.

Ты опять не прав. Тотальная русификация белорусов началась во времена СССР. Белорусы в 1918 году создали своё независимое национальное государство, которое было уничтожено русскими. Русские тогда себя назвали большевиками. Была военная интервенция в Беларусь со стороны России.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Тот_Самый_Анонимус__ , 17-Июл-23 20:07 
>Сказать, что "русский язык востребован" не правильно. Просто белорусы забыли родной язык, по привычке, с детства приучены русскому языку.

Белорусский — диалект русского. Это всё равно что сказать что москвичи забыли московский «язык» (а говор отличался от современного русского, да-да), а новгородцы — свой.

Какой он им родной, если они на нём не говорят?

>Ты опять не прав. Тотальная русификация белорусов началась во времена СССР.

Не рассказывай мне байки. Коренизация в СССР была будь здоров. Я тебе по своей автономии (Чувашии) могу сказать, что моя бабушка, когда писала статьи научные по медицине даже для газет переводила на чувашский язык.

Просто все малые языки (белорусский и украинский говоры, чувашский, татарский. марийский и прочие) неконкурентоспособны. на них можно петь народные песни, но на большее они не способны.
Современный язык должен быть языком наукии техники, иначеносителям придётся учить ещё один язык.

>Белорусы в 1918 году создали своё независимое национальное государство

Кто создал? Крестьянам было всё равно, и только нацмаргиналы боролись за «независимость». Причём лично свою. Местные князьки захотели своё государство. чтобы панувати. Интересам жителей это ничуть не соответствовало.

>Была военная интервенция в Беларусь со стороны России.

Русские вернули в своё государство то, что хотели от него оторвать.

Если бы беломова была востребована жителями, то они бы ей пользовались, ибо даже законы на их стороне. Но она проиграла, как и укромова. Смиритесь уже с этим. Умейте видеть факты, а не прикрываться своим маня-мирком.

В качестве примера востребованности языка приведу сербов, или русских в Прибалтике и на Украине: несмотря на все притеснения люди отстаивают своё право на язык.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено feudor , 18-Июл-23 00:00 
мне кажется ты сейчас путаешь белорусский и польский языки. да вот угадывать не надо о том что ты ошибочно себя считаешь польским патриотом.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 18-Июл-23 16:22 
Он не путает. Он говрит, что польский ближе к белорусскому чем русский.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 16:31 
Скорее по университетам/школам какая-то местная НКО или прогрессивно мыслящий чиновник-технократ дал разнорядку.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 13:32 
Как будет кошка-жена на белорусском?:)

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Bob , 17-Июл-23 14:52 
Для перепродажи в РФ или внутреннего потребления?
--
kotka-žonka или žančyna-kotka. От Востока на Запад, Беларуси)

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 14:59 
А почему латиница? В Белоруссии вроде кириллица.

Это похоже больше на польский.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 17:59 
Это лацiнка. Есть аж три способа записи белорусского - два кириллицей (официальный-советский и классический, "тарашкевица"), и латиницей.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 18-Июл-23 16:05 
В Беларуси есть официальная (с ГОСТом и всеми делами) латинка (написание латиницей). Просто они почти не используется официально. Но её вполне можно наблюдать вживую, при желании - например в Минске в метро название станций (на схемах) продублированы как раз-таки официальной латиницей.

P.S. На территории Беларуси латиница использовалась заметно дольше, чем современная "кириллица" (советского образца).


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Тот_Самый_Анонимус__ , 18-Июл-23 23:48 
>В Беларуси есть официальная (с ГОСТом и всеми делами) латинка (написание латиницей).

Это не для письма и делопроизводства. а для транслитерации при необходимости. Я тебе страшную новость расскажу: русский тоже дублируется в латиницу. Например, на банковских картах или загран паспортах. что не говорит об официальности.

>P.S. На территории Беларуси латиница использовалась заметно дольше, чем современная "кириллица" (советского образца).

Ну, блин, ты сравнил. На территории Гонконга и латиница использовалась дольше иероглифов, ибо колонизация.
Но на территории Белоруссии, как государства, а не территории кириллица рулила всегда, чего бы вам, её противникам, быне хотелось. Бгг.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 21-Июл-23 12:54 
>Это не для письма и делопроизводства. а для транслитерации при необходимости. Я тебе страшную новость расскажу: русский тоже дублируется в латиницу. Например, на банковских картах или загран паспортах. что не говорит об официальности.

Ты пишешь о том, в чём не разбираешься, мамкин специалист по всему. В отличии от русского, для белорусского есть именно настоящая латиница (в том числе ГОСТовая, официальная). И это не транслитерация. Там в ней (в отличии от тнслита) есть буквы (символы букв), которых нет в стандартной латинице (в которую и осуществляются транслитерации). Кстати, транслит в латинку у белорусского тоже есть (как и упомянутый тобой транслит для русского), но это отдельная сущность.

>Ну, блин, ты сравнил. На территории Гонконга и латиница использовалась дольше иероглифов, ибо колонизация.

Я ничего не сравнивал. Это просто факт. Проверяемый очень простым подсчётом.

>Но на территории Белоруссии, как государства, а не территории кириллица рулила всегда, чего бы вам, её противникам, быне хотелось. Бгг.

Ты снова пишешь о том, в чем не разбираешься. Как раз-таки кириллица была еще МЕНЬШЕ по времени, если считать без перриодов "как территории, а не государства". И, соответственно, период использования латинки "как у государства, а не территории" - еще дольше.

>чего бы вам, её противникам, быне хотелось. Бгг.

Я не противник - я на ней сейчас пишу. Это просто ты необразованный и ограниченный настолько, что неспособен даже посчитать (ну хотя бы на калькуляторе, раз без него не получилось) периоды латинки/кириллицы и государственности/территориальности (и их пересечений).


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Тот_Самй_Анонимус__ , 21-Июл-23 14:39 
> Ты пишешь о том, в чём не разбираешься, мамкин специалист по всему. В отличии от русского, для белорусского есть именно настоящая латиница (в том числе ГОСТовая, официальная).

Официальная — это когда на ней документ подать можно. Остальное для мамкиных латинизаторов.

> Я ничего не сравнивал. Это просто факт. Проверяемый очень простым подсчётом.

Это когда под оккупацией находилась. Считай времена рабства, но про Гонконг выше написал. Попробуй понять. Понимаю что сложно, но постарайся.

> Я не противник - я на ней сейчас пишу.

Ты противник, потому что банально лжёшь. А пишешь, потому что иначе бы твою пропаганду удаляли бы. У тебя нет выбора, а был бы выбор, то он очевиден.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 16:16 
Изначально была латиница, точнее лациника - белорусский латинский алфавит.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено мшефд , 19-Июл-23 22:59 
>Изначально была латиница

Скорине расскажи.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Ананий , 17-Июл-23 16:25 
>мяшок бульбы

разве это плохо? яб не отказался от десятка


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 20:06 
Лучше не надо Лукашенка топит за увеличение объёмов. А высокая урожайность продукции ведёт к снижению питательных свойств картошки.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено dannyD , 18-Июл-23 07:14 
какие свойства? углевод он и есть углевод.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 11:26 
>добавлены пушту, албанский, амхарский

Ангмарский, квенья и чёрное наречие тоже надо добавить.


"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 14:35 
На пушту, албанском и амхарском говорят десятки миллионов.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено 48 , 18-Июл-23 08:31 
и на пингвиньем тоже

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Чукча , 21-Июл-23 14:41 
Луораветланский важнее всех остальных.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено n00by , 22-Июл-23 09:47 
Два копальхена тому хозяину оленей.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено don Rumata , 17-Июл-23 17:19 
Надиктовал как мог, начал проверять, только до 9-го места добрался. А там ещё и тексты надо поприсылать и попроверять. Да, работы дофига.

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено Аноним , 17-Июл-23 20:02 
Бедьняга. Ты ведь хотел, чтобы было быстро и легко да?

"Обновление голосовых данных Mozilla Common Voice 14.0 "
Отправлено don Rumata , 18-Июл-23 01:00 
> Бедьняга. Ты ведь хотел, чтобы было быстро и легко да?

Где я говорил, что хочу быстро и легко?

Покажи свой вклад, кстати.