URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 124939
[ Назад ]

Исходное сообщение
"Обновление голосовых данных Mozilla Common Voice 7.0"

Отправлено opennews , 01-Авг-21 10:48 
Компании NVIDIA и Mozilla представили обновление наборов голосовых данных, собранных в результате инициативы Common Voice и включающих примеры произношения 182 тысяч людей, что на 25% больше, чем 6 месяцев назад. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=55571


Содержание

Сообщения в этом обсуждении
"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 10:48 
Я тут заметил, что качество автогенерируемых субтитров на тытрупе ощутимо выросло (в том числе, на русском языке, хоть и хуже). Причём, распознавание работает несмотря на музыку и шум. Я что-то пропустил? Как такого добиться?

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 10:52 
Люди постят субтитры. Тытруп стал получше, но с японским он все так же лажает как и с русским.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 10:56 
> Люди постят субтитры. Тытруп стал получше, но с японским он все так
> же лажает как и с русским.

Часто бывает такое, что я не могу понять, что за слово (из-за дефектов речи или особенностей дикции), а оно вот распознаёт верно. Так в целом конечно много ошибок.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 08:29 
> Люди постят субтитры.

Гугол придумал как дешево и сердито заапгрейдить нейросетки на порядки, без нвидии :)


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 11:44 
Не заметил какой-либо разницы в английском и японском, автоперево (особенно для азиатской группы языков) всё такой же трешак.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено nebularia , 02-Авг-21 06:18 
Речь всё-таки не про перевод, а про распознавание. С ним довольно хорошо, видео ютуба с нужными гайдами по работе без звука смотрятся неплохо

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 12:17 
Так я и писал не только про перевод. Распознавание такое же костыльное - спотыкается на созвучных словах и даже иногда на артиклях. Точно так же было и год-два назад.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено nebularia , 03-Авг-21 10:52 
> спотыкается на созвучных словах

Поэтому оригинал читать можно, так как понятно, что там могло быть. А при переводе превращается в кашу.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 11:26 
>Данные опубликованы как общественное достояние (CC0).

Единственная нормальная свободная лицензия.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено 1111 , 01-Авг-21 12:39 
>Единственная нормальная свободная лицензия.

единственная нормальная - это жпл, потому что не заставляет нахаляву работать сообщество на копиистов и капиталистов, ну или точнее заставляет паразитов что то отдавать сообществу назад.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 13:28 
>>Единственная нормальная свободная лицензия.
> единственная нормальная - это жпл, потому что не заставляет нахаляву работать сообщество
> на копиистов и капиталистов, ну или точнее заставляет паразитов что то отдавать сообществу назад.

И как там с исправлением и улучшением EXT от гугла? Уже заставили? Или опять  "не нужно и вообще, не очень хотелось - мы тут EXT4 успели написать и даже собрать почти все грабли!" ?



"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено maximnik0 , 01-Авг-21 23:32 
>И как там с исправлением и улучшением EXT от гугла? Уже заставили?

Есть  физ.лицо и есть юр.лицо ,компания.Пока гпл код пользуется внутри компании,право выкладывать его не возникает,т.к они приобретают права потребителя согласно лицензии (по крайне мере такое объяснение было в статье linuxformat).И была неопределенность для   сетевых сервисов- это недостаток гпл2,в 3 версии промах устранили.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 02:27 
>> единственная нормальная - это жпл, потому что не заставляет нахаляву работать сообщество
> на копиистов и капиталистов,
> Есть  физ.лицо и есть юр.лицо ,компания.Пока гпл код пользуется внутри компании,право
> выкладывать его не возникает,т.к они приобретают права потребителя согласно лицензии

Угу, кто бы сомневался, что облачные сервисы гугло-амазонов, с многомиллиардными прибылями и выкладыванием "на тебе Бож^W сообщество то, что невыгодно поддерживать нам самим" - "это другое" и "лицензия позволяет!".

>> Mere interaction with a user through a computer network, with no transfer of a copy, is not conveying.
> (по крайне мере такое объяснение было в статье linuxformat).И была неопределенность для
> сетевых сервисов- это недостаток гпл2,в 3 версии промах устранили.

Ага, только совсем не в пользу "сообщества". Возможно, вы хотели указать на AGPL?



"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 08:31 
Опять этот чувак с родовой травмой EXT'а. Блин, ext4 то уже не сильно нужен стал, а его не попустит. И он все так же не покажет альтернативы где все это сработало бы лучше.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 15:10 
> Опять этот чувак с родовой травмой EXT'а.

Классический и известный пример, что не так, чудик? Даже если тебе лично патчи на производительность и надежность ext2 не нужны были, потому что ты тогда под вендой сидел.

Лицензия, которая типа "заставляет нахаляву работать сообщество на копиистов и капиталистов, ну или точнее заставляет паразитов что то отдавать сообществу назад", позволяет отдавать гугло-амазону-клаудфляри хоть дырку от бублика, хоть только то, что просто невыгодно поддерживать самим - поди узнай, что они еще назажимали "для внутреннего пользования".

> Блин, ext4 то уже не сильно нужен стал, а его не попустит.
>> "не нужно и вообще, не очень хотелось - мы тут EXT4 успели написать и даже собрать почти все грабли!"

Да-да, "это было давно и поэтому почти неправда!"
Но все же, какое меткое описание получилось.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 17:17 
Но это уже не свободная лицензия, раз она ограничивает чьи-то права

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 19:49 
Не занимался демагогией. Дураков тут нет.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Ordu , 02-Авг-21 03:44 
> CC0 enables scientists, educators, artists and other creators and owners of copyright- or database-protected content to waive those interests in their works and thereby place them as completely as possible in the public domain, so that others may freely build upon, enhance and reuse the works for any purposes without restriction under copyright or database law.
> ...
> while no tool, not even CC0, can guarantee a complete relinquishment of all copyright and database rights in every jurisdiction, we believe it provides the best and most complete alternative for contributing a work to the public domain given the many complex and diverse copyright and database systems around the world.[1]

[1] https://creativecommons.org/share-your-work/public-domain/cc0/


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Анонимный Аноним , 02-Авг-21 10:30 
> это уже не свободная лицензия, раз она ограничивает чьи-то права

Любая лицензия ограничивает какие-либо права - такова природа лицензий. Лицензия на то и существует, чтобы отделить правомерные условия использования от неправомерных, а это уже ограничение чьих-то прав и интересов.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 19:47 
Согласен с тобой, но про капиталистов ты перегнул. Очистки свою башку от коммунизма.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 16:43 
Начни с очистки своей. Судя по твоему короткому комментарию, там есть чем заняться.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено th3m3 , 01-Авг-21 12:43 
Да, но копирасты и тут влезают. Издают произведения в коммерческих целях, а потом блочат материалы по всей сети, якобы у них есть какие-то права.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 12:50 
Так ведь по дате надо смотреть. Если что-то по cc0 опубликованно раньше, то всё. Копирастец идёт на конец

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено th3m3 , 01-Авг-21 13:13 
Ага, передайте привет Литресу)

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено dullish , 01-Авг-21 13:56 
По многочисленным заявкам передаём привет и ставим песню группы "Ленинград"...

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 14:19 
>и ставим песню группы "Ленинград"...

Дорожную?


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 18:52 
теперь ещё и сделают автоматический поиск и замену неинклюзивных слов и автобан за произношение неправильного слова. а в россии будет автовызов полиции за неправильное слово и блокировка кредитной карты

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Kuromi , 01-Авг-21 19:39 
"Интересно, что на втором месте по размеру накопленных данных язык руанда, для которого собрано 2260 часов."

Да все просто, наверное Мозилла с Невидией платят какую-то копейку носителю языка за его диктовку, а в Руанде работы нет ВООБЩЕ, так что все население ломанулось диктовать...
Это примерно та же ситуация когда рост битков помогал выживанию населения Венесуэллы, майнящего потихоньку на бесплатном электричестве.


"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 19:46 
Голоса алкашей распознает?

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 20:18 
Я пока что не тестировал

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 12:46 
Проблема речи алкашей в том, что они невнятные.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 01-Авг-21 23:34 
Внутренние?

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 02:47 
Нет, твой не распознает.

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 02-Авг-21 08:55 
Бэкдорчик для корпораций зла по сбору телеметрии. Мозилка скатилась конечно. Хотя после прошедших событий я ничему не удивляюсь. Сам жертвовал мозилке, а потом обнаружил что они деньги угрохивают в ИНКЛЮЗИВНОСТЬ и прочие нетехнические ЛГБТ-%#^, одновременно сокращая тех. персонал (Rust считай закопали).

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 03-Авг-21 16:56 
Так потому что фонды это фуфельность. Сегодня уже есть возможность сделать инвестирование в фичу. В частности был полудохлый проект БоунтиБоне или как-то так и там можно было предложить фичу и на нее переводить деньги и как только кто-то ее реализует и сообщество как-то подтвердит реализацию бабло делилось по контрибьюторам. Вот будущее фондов, а так да всякое гомно финансировали. Я вот тоже теперь хочу офрмить возврат инвестиций в фонд мозиллы

"Обновление голосовых данных Mozilla Common Voice 7.0"
Отправлено Аноним , 05-Авг-21 21:43 
MP3, когда есть OGG, Opus — это конечно сильно.