Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=57102
Друзья, про Воск можно не повторять в каждом новом выпуске MCV ;) Один раз написал уже.
Очередные зонды и телеметрия
Кто про что, а тролли с опеннета - про зонды и телеметрию. Оргазмируют видимо от них.
Честному анониму Опеннета нечего скрывать
Меня в некотором смысле удивляет дикая активность белорусов - в 5 раз больше материала чем на русском (и всего примерно в 3 раза меньше английского). Кроме того, у них даже прирост больше - 67 часов против 8 у русского, т.е. отставание нарастает.
Впечатляет.
И это при том, что в самой Беларуси все говорят на русском, кроме 3,5 змагаров
У нас много людей говорит на родном языке. А со своим шовинизмом можешь проследовать по известному адресу.
У нас много людей понимает, что это важная штука в плане потенциальной голосовой поддержки языка в разных сервисах, была целая информационная кампания в соцсетях, много активных людей и энтузиастов подключилось
Вне городов говорящих довольно много. Это просто искажение восприятия из-за того, что многие дальше Минска нигде не были (а в реальности даже и в Минске зачастую не были).
Во-вторых, на самом крупном (теперь уже самом) новостном ресурсе была новость в своё время - привлекла внимание многих.
Ну и в-третьих, важность родного языка, даже если в повседневности им не говоришь, у многих сохраняется. Его "непопулярность" - явление довольно искуственное.
А есть торрент ?
нету. для скачивания можно рандомную почту вводить
До сих пор умиляет призыв "Пожертвуйте свой голос"
Принимал участие в записи, и там есть фатальный недостаток: мало текстов.
Их можно добавлять, но это сделано не совсем удобно и очевидно.В итоге есть желание и дальше записывать, а по факту нечего - идут дубли.
Если кто-то хочет сейчас помочь, добавляйте тексты из источников относящихся к культурному наследию.
а не проще войну и мир один раз добавить? там на миллиард часов наберётся
Добавь.
Тебе придётся разбивать её на кучу мелких предложений (меньше твитов) и для каждого заполнять анкету с указанием источника и капчей (вроде, не помню).
Глянул.Короче. Капчи нет. Но там кто-то уже залил целую Анну Каренину, теперь нужно проверить и подтвердить фразы вот тут: https://commonvoice.mozilla.org/sentence-collector/#/en/review
Не достаточно их добавить, нужно ещё что кто-то проверил и утвердил на соответствие правилам.
> белорусского языка ... 6326 участников и 1054 часа
> русского языка ... 2585 участников и 201 часАХАХА
даже узбекского больше, я пердоле)
>даже узбекского большеОй шайтан!