Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Качество речи на битрейтах 3.2 kbps, 6 kbps и 9.2 kbps при использовании кодека Lyra примерно соответствует битрейтам 10 kbps, 13 kbps и 14 kbps при использовании кодека Opus. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=58100
> воссоздать недостающую информациюСкажешь "книга" на созвоне, а потом тебя в расисты запишут
Мы готовы пойти на этот риск.
> Мы готовы пойти на этот риск.Вы -- расисты? Сегодня вроде быстрый гигабитный интернет у каждого в кармане, неужели они там на западе не могут купить у китайцев нормальных вышек мобильного интернета?
> Сегодня вроде быстрый гигабитный интернет у каждого в карманеХорошая шутка.
С тех пор, как 10 гигабитный проводной интернет стал доступен, не такой быстрый, конечно, и есть определённые оговорки как вроде в бункере работать хорошо не будет.
В бухгалтерии что-то перепутали и Лупа получил 10 гигабитный интернет, а дорогие россияне ростелеком.
У ростелекома разве только GPON?
10 гигабит до свича - хороший повод брать с нелоха в два раза больше, чем с нелоха, у которого только 1 гигабит до свича, и который, в свою очередь, платит тоже всего лишь в два раза больше, чем обычный лох на стомегабитном тарифе.
А у свича сколько гигабит? Нет, я, конечно, слышал, что не везде в мире есть привычные россиянам скорости интернета. А насчёт стоимости, ты предлагаешь платить около 10 USD за 10 гигабит, я правильно понимаю? Это обходится несколько подороже + стоимость оборудования, это не езернет. Некоторые провайдеры конечно ещё агрессивно шейпят трафик и режут скорости, но приличные таким не занимаются.
Подозреваю, что скорость трафика они режут не потому, что злые и вредные, а потому, что от абонента до свича у них гигабит (который они форсят в рекламе), а за свичом - какой-нибудь мукс с STM-16 на 2.5 гигабита (на всех), а то и вовсе STM-4 на 622 мегабита.
Если это сэкономит траффик на халявном VPNе, то можно хоть в расисты, хоть в мизогинисты, хоть в боди-отрицательные, хоть в нефте-сторонники, хоть в LGBTQ-фобы, хоть в что-там-в-SJW-методичке-написано записаться - на самом деле я не расист, но что там неадекватные SJW подумают - глубоко по**й.
> Скажешь "книга"...Это мем какой-то? Не могу понять при чем тут "книга" и расисты.
Ну а ты попробуй произнести слово вслух
Книга-книга-книга! https://www.youtube.com/watch?v=_ng1ovEr46c
>Это мем какой-то?Нет.
>Не могу понять при чем тут "книга" и расисты.
Слово Niger американцы произносят как "нига". А в русском слове "книга" первая буква произносится глухо т.е. иностранец первую букву вообще не услышит. Среди русской диаспоры в США не принято произностить слово "Майонез" так как оно созвучно с английскими словами: My own ass - "майоунэс". переводится, как "Моя личная задница", или "Задница находящаяся в личной собственности".
В Бразилии не произносите слово "Сергей" там это слово переводится как "Я гей". Если вас зовут Сергей, говорите всем, что вас зовут Сержио или Серж.
А вот это интересный вопрос, они там нейросетку под каждый язык отдельно тренируют? А то ведь на самом деле звучание языков-то разное.
всмысле под каждый? разве есть языки кроме английского?
Когда то я играл на лире ... Одной рукой играл, другой компилировал ядро Линуса ...
— Вы пойдете на Шаляпина?— Нет, мне Шаляпин не нравится. Фальшивит, картавит, тенорок какой-то слабенький...
— Хм. А вы где его слышали?
— ̶Д̶а̶ ̶м̶н̶е̶ ̶н̶е̶д̶а̶в̶н̶о̶ ̶Р̶а̶б̶и̶н̶о̶в̶и̶ч̶ ̶н̶а̶п̶е̶л̶ ̶п̶о̶ ̶т̶е̶л̶е̶ф̶о̶н̶у̶.̶ скачал .lyra и послушал
Где можно почитать про *разметку*?
в одних и тех же комментах разметка работает или не работает в зависимости от того, где их смотришь: в новости или в форуме.
Я вот заметил, что если сообщение становится "скрыто модератором", то если смотришь как новость, то тэги начинают работать
Интересно, а другие теги? Особенно javascript?
Что-то у тебя с логикой не то. Анекдот вообще не в тему получился.
> формат передаваемых данных изменился и не совместим с прошлыми выпускамии часто так ломать будут?
> позволяющая воссоздать недостающую информацию на основе типовых характеристик речиВот интересно, есть же разные речевые особенности. Например некоторые картавят. А некоторые южане хэкают вместо звука гэ. Т.е. в рамках одного языка уже бывает разница, приятная для одних групп, и неприятная для других. А если брать китайский, там еще важен тон звука. И наборы звуков между языками вообще весьма сильно отличаются. Они эту модель обучили универсально для всех языков? Каким образом?
> Каким образом?Есть у нефтяников шутка: 100% извлечение нефти путём выкапывания траншеи шириной 100 метров и глубиной 2 км... Это намёк на размер Искусственного Идиота.
Сейчас другие траншеи более востребованы.
Помнится, уже копали ров с крокодилами в 2014, там ещё Кролик поставил 20 метров забора...
> наборы звуков между языками вообще весьма сильно отличаются.Есть универсальный набор, включающий эти все. Врождённая категоризация звуков, которая в течение первого года жизни упрощается так, чтобы различать те звуки, которые нужно различать в родном языка, и не различать те, которые надо не различать (или не надо различать). Этот универсальный набор не просто конечен, он не такой уж и большой.
Сложность может быть в том, чтобы эти категории вычислить, но, во-первых, лингвисты это уже сделали в XIX веке (глянь в википедии на IPA), во-вторых, нейросетка и сама горазда выделять категории и нащупывать их границы. А если объединить лингвистов с нейросеткой... И дополнить их тестерами с разными нативными языками/диалектами...
> от интересно, есть же разные речевые особенности. Например некоторые картавят.
В одном языке это называется картавость, а в другом языке вполне легитимный звук. Если у нас есть универсальный код для всех различимых человеками фонем, то т.н. картавость вполне будет кодируема.
> А если брать китайский, там еще важен тон звука.
Что я подозреваю, получится автоматически без специальных телодвижений вокруг китайского языка, потому что все языки используют тон. Так получается, что китайский тоном кодирует фонемы, а мы эмоционально инТОНируем. То есть научив кодек кодировать интонации, автоматом получим и кодирование тональных языков.
Опять мышинное обучение где попало суют.
Припоминается баг в МФУ какой-то фирмы, когда символы некорректно распознавались и подменялись другими
> МФУ какой-то фирмына "X" начинается, на "x" кончается...
Хйюлит Пакард?
>> МФУ какой-то фирмы
> на "X" начинается, на "x" кончается...А точно "Сканеры и копиры Xerox могут менять цифры в документах при копировании" https://habr.com/ru/post/189010/ !
> , но формат передаваемых данных изменился и не совместим с прошлыми выпусками.Данных передаваемых кому и куда? Вопрос, если что, риторрический.
https://www.cnx-software.com/2021/02/28/lyra-audio-codec-ena.../https://en.wikipedia.org/wiki/Lyra_(codec)
Нытики, блин. Сравните качество по битрейту с существующими форматами (по обеим ссылкам), потом нойте, что ML не туда применили.
> MLВообще нужно запретить на законодательном уровне. Это не то направление, по которому должен двигаться прогресс. Лично я вижу в скором времени огромную катастрофу для многих людей, чей труд может стать невостребованным.
> Лично я вижу в скором времени огромную катастрофу для многих людей, чей труд может стать невостребованным.Такое уже было в истории. Промышленная Революция устроила такое. Сначала она отняла прядильное дело у домохозяйств (в которое до ПР вливались десятки процентов всех человекочасов), а затем традиционное кузнечное дело заменила на промышленные литьё и прокат стали. И хрен с ней с пряжей, но кузнецы были квалифицированными специалистами, которые подмастерьями учились лет пять, не меньше. В любом населённом пункте покрупнее был кузнец, но всё на что они могли надеятся после того, как цены на сталь упали в десять раз -- это устроится неквалифицированным сталелитейщиком.
На фоне последствий ПР, кстати, и вылез Маркс рассказывать о том, что капитализму кирдык светит.
> Это не то направление, по которому должен двигаться прогресс.
Это именно то самое направление. Рутина должна выполняться машинами. Тогда у человеков просыпается креативность, и они начинают искать себе новых применений. И со временем находят. Не было бы Промышленной Революции, не было бы никакого Intel'а, чтобы создать x86.
Направление прогресса должно расширять круг востребованных профессий, а не сужать!
Вонючих луддитов нужно отправлять в дурку. Вместо того, чтобы постоянно быть в курсе технологий, адаптирования их под себя и адаптирования к ним, они ноют про снижение прямого человеческого фактора в производственных процессах товаров и услуг и что бедненькие не смогут себе хлебушка купить. Тьфу.
Скайнет, Терминаторы и Сайлоны на подходе, да. Шутка, на самом деле просто 9Х% населения окажется "ненужно" и будет социальный ппц.
Часто в переписке читаю, гр@банное автодополнение. Прям вижу как все эти мудоскайпы и телемосты будут начинаться как в театре. "Просим говорить медленно, не есть и не употреблять воду во время совещания, отключить автодополение. Инструкция по отключению...“