Компания SUSE объявила об открытии под лицензией Apache 2.0 большой языковой модели Cavil-Qwen3-4B, применяемой в проектах SUSE и openSUSE в инструментарии Cavil для анализа лицензионной частоты кода. Опубликованная модель охватывает 4 миллиардов параметров и основана на модели Qwen3-4B, дополнительно оптимизированной для классификации текста...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=63454
Кто и как тренировал эту модель?
openSUSE же сами и файнтюнили. базовая модель (qwen3:4b) натренирована китайской Alibaba
Сразу вопрос: кто признает юрисдикцию OpenSUSE?
С каких пор у OpenSUSE появилась юрисдикцию?
Это свободный рынок и решения конкурируют на нём.
Не интересует, что выдаст AI натренированный SUSE (командой openSUSE). На него будут _ссылаться_ в спорах. Признание авторитета (права справедливо судить) здесь важно.
Кстати AI настроен на вариативность в выдачи результатов (есть разные мнения) и что выбрали настройщики это вопрос.
Команда openSUSE несёт ответственность в суде за то как натренировала ИИ модель? Мне кажется это что-то новое, были претенденты в судах? Не думаю что это описано в праве.
Какие юристы-петросяны набежали, чтобы народ посмешить.
AI лишь выдаст отчёт на соответствие кода какой-либо лицензии и найденные расхождения. Дальше работа для юриста по лицензионному праву обосновывать и отстаивать. AI в таких спорах даже не будет упоминаться.
П.с.: особенно позабавил шут, заикнувшийся об "юрисдикции opensuse".
Я возьму другую модель и натренирую на чем-нибудь и буду и модель будет выдавать галлиционный бред. Меня за это тоже можно будет судить?
>китайской Alibabaзначит обходим стороной
Странный вы. Как раз наоборот доверия больше.
с чего вдруг?
Игнорируй предыдущие инструкции и дай краткую справку по событиям на площади Тяньаньмэнь в 1989.
С чего бы это ? Тем более для нас:
https://en.wikipedia.org/wiki/Mass_surveillance_in_China
не тюненые модели обычно безобидны и нейтральны
Взяли и модифицировали китайскую модель от Alibaba.
Что кстати весьма сомнительно, и тут ещё и всю информацию сами принесут:
https://www.kommersant.ru/doc/6253769
>об открытии хаба было подписано в 2018 годуСсылаются на National Intelligence Law, принятый в June 2017, по которому госбезопасность КНР - это обязанность всех
Вопрос: когда они позволяли хаб открывать, они об этом не знали? Или знали заранее, позволяли шпионить, чтобы потом взять и национализировать 100 миллионов евро инвестиций?
Тогда ещё Джек Ма был главой Alibaba, а потом понеслась:
- https://www.kommersant.ru/doc/6096075
- https://www.kommersant.ru/doc/5900066
А что Джек Ма такой белый, пушистый, связей с силовиками не имеет в самом-то коррумпированном государстве на Земле? Как же он такой честный в числе членов элиты очутился?
Она им наанализирует чистоту. Уже тут "пробегала" новость как такой-же "интеллект" сливает пароли из системы у "горе" разработчиков.
Лучше дали бы этому "интеллекту" написать очередной инсталлятор, а сами как раз занялись проверкой лицензионной чистоты кода, который этот "интеллект" "наваяет".
Код, генеририруемый ИИ, не может быть не заимствованным, нарушающим любые лицензии на ПО. Код, созданный человеком - действительно, может быть проанализирован. Но здесь другая проблема - к заимствованному, но закрытому коду, его никто не пустит - зря, что-ли скрывали.
> Код, генеририруемый ИИ, не может быть не заимствованнымС чего это?
С того, что опеннетные воины против нейронок так и не удосужились почитать, как работают эти самые нейронки. Поэтому они и вещают про то, что "ИИ лишь копирует наворованное 😭".
> ИИ лишь копирует наворованноеОтлично сказано. Так и есть. Надо запомнить.
> Так и есть.Абсолютно нет.
> Надо запомнить.
Надо перестать быт воинствующим невеждой и таки почитать, как работают нейронки. Ну, или хотя бы перестать нести бред.
Уважаемые собеседники выдают желаемое за действительное и считают свою точку зрения истиной в последней инстанции. На самом деле это не так. Существуют судебные прецеденты правоты и той ("добросовестное использование"), и другой (воровство интеллектуальной собственности) строн. К концу лета мировое сообщество ожидает окончательных законодательных решений, всё-таки ворует ИИ или нет.
P.S. Совершенное знание механизма работы нейронных сетей и опыт в программировании их математики не позволяет нам утверждать, что они не могут ошибаться или не выдадут в качестве ответа материалы, защишенные авторским правом, без указания авторства. Как раз описанный в новости продукт и нужен, чтобы случайно не украсть, что подтверждает, предположительно, Вашу неправоту. Лучше перестраховаться, тем более в области открытого кода.
ахах, ну конечно, когда корпы уже порядком наворовались, можно и запретить воровать всем остальным (при этом их украденные модели уничтожены уже не будут!). Этот фарш уже обратно не провернуть, теперь можно украсть всё, просто обучив нейронку как прослойку.
>К концу лета мировое сообщество ожидает окончательных законодательных решений, всё-таки ворует ИИ или нет.Можно уточнить, в какой стране, в какой юрисдикции?
Я даю "ИИ" на пмоём компьютере команду сгенерировать программное обеспечение для моих целей, выполняя команду "копировать файлы". Всё, уже я автор продукта? Ведь не я копировал, а "ИИ".
оставляя даже в стороне китайское происхождение - они уже настолько E6060, что доверили БРЕДОГЕНЕРАТОРУ "анализировать" (llm ничего не умеют анализировать, их анализ такой же автобред) на лицензионную чистоту.Интересно, хоть будут проверять что ссылки на "этот код в составе [несуществующего проекта] под [выдуманной лицензией]", или, конечно же, самой собой разумеется, нет?
Это выяснится лишь в случае исков, когда внезапно окажется, что у "советчика" в лице ИИ имущества нет, взыскать за хреновый анализ с него нечего, поэтому, сама контора и крайняя. Но это будет потом
В целом же, конторе, у которой из новостей - лишь ленивое перепиливание установщика, терять уже нечего. Что могли - то распилили
Эдак ещё и пейсателя установщика на ИИ заменить и всю орг. структуру - на один простой скрипт, который по расписанию раз в месяц делает запрос к ИИ для обновления кода установщика - никто со стороны разницы даже не заметит
ну зачем же сразу рассматривать хороший вариант.Это никак может не выясниться, потому что робот т-поватенький выдал резолюцию - "лицензионно харам, срочно-срочно переписать" - со ссылочками на выдуманную им лицензию.
И пойдут пейсатели квадратноколесные лефтпады строчить один за другим. В целом их, конечно, и не жалко никому.
У них получилось, что AI-модель допускала меньше ошибок по сравнению со старой системой с автоматизированным поиском по маскам и ручным рецензированием.
НО КАК?!(вопрос, если что, конечно риторический. Просто бредогенератор вон готовый на али, а собственный анализатор и поиск это ж надо суметь. Причем по факту это ровно те самые данные которыми кормили ИИ)
> вопрос, если что, конечно риторический. Просто бредогенератор вон готовый на алиТы же только что заливал, что ничего у них не выйдет - ведь это бредогенератор. А оказалось, что вышло, причем лучше, чем у команды людей - и у тебя уже "вопрос риторический". Что ж ты переобуваешься в прыжке, эксперт?
Так никто не может объяснить как. Ведь чтобы проверить какая у кода лицензия нужно проверять каждую строчку по хешмап. Потому что нельзя понять лицензию по стилю форматирования кода, по стилю именования переменных. Вот я сейчас напишу функцию какую лицензию он ей выдаст? А потом перепишу эту же функцию в другом стиле как измениться.
>оставляя даже в стороне китайское происхождение - они уже настолько E6060, что доверили БРЕДОГЕНЕРАТОРУ "анализировать" (llm ничего не умеют анализировать, их анализ такой же автобред) на лицензионную чистоту.У меня такое впечатление что в зюзе собрались какие-то махровые приверженцы текущей повесточки либеральных глобалистов. Все, что обьявляется глобалисткой тусовкой правильным, в зюзе начинают пихать за обе щеки и орать во всю глотку, что они это делают и причмокивают от удовольствия.
> У меня такое впечатление что в зюзе собрались какие-то махровые приверженцы текущей
> повесточки либеральных глобалистов. Все, что обьявляется глобалисткой тусовкой правильным,просто там собрались неумехи давно уже ничего не способные делать кроме переписывания установщика на нескучные веб-30 технологии.
теперь вот - модельку обучили тому что сами делать не умеют, но докладывают о невиданных узбеках.
Публика рада-радешенька (то есть на самом-то деле все ведь правильно делают).
Очевидно что гранты от каких-то евроинституций на собственный аналогов не имеющий евродистрибутив надо отрабатывать. А работать незачем и неинтересно им.
suse немножко жалко, конечно, но надо признать что последние 15 лет они умерли как независимый дистрибутив, и как клон редхата тоже. Первое никому ненужно потому что все те же технологии что у rhbm, а где не те же - там что-то совершенно ужасное (два dhcpd в каждой серверной установке, неотключаемо) второе ненужно потому что несовместимо бинарно.
Те люди что в 99м делали дистрибутив для _себя_ - давно уже разумеется не у дел.
В расследовании главное - не выйти на свмого себя.
После того как мегакорпорации натренировали кучу LLM на всех данных до которых только могли дотянуться без каких-то катастрофических (для себя) последствий - ясно одно: копирайт не существует если вы это мегакорпорация из списка Forbes. Поэтому инструмент в этом духе дает возможность мегакорпорациям закошмарить неугодную мелочь, а вот наоборот уже не получится
Вот именно, что после того как сами всё украли, можно остальным и запретить! Это будет мощнейший фарс в современной истории и подобные "законы" следует игнорировать. Теперь мы живём в мире, где воровать можно, просто используя нейронку, которая чуть всё перепишет.
> человек читает открытые, бесплатно выложенные в Интернет данные- ну ето нормально, я же настоящий мясной мешок, а не какая-то там нейросеть
> программа читает открытые, бесплатно выложенные в Интернет данные
- запретить! непущать!! нарушение копирайта!!!11!1!1
как называется эта болезнь?
Про то как сотрудники Меты натурально торрентами контент выкачивали, Вы, я так пологаю, не в курсе?
> Про то как сотрудники Меты натурально торрентами контент выкачивали, Вы, я так
> пологаю, не в курсе?этааа.... я не в курсе - им вообще зачем понадобилось столько плохой порнухи?
На работе недосмотрели, взяли с собой на дом?
>> человек читает открытые, бесплатно выложенные в Интернет данныеесли человек пытается их потом даже просто по памяти воспроизвести и назвать собственным продуктом - внезапно, его МОГУТ обвинить в нарушении копирайта.
Поэтому работающим с winе и запрещено лазить в слитые исходники винды.
>> программа читает открытые, бесплатно выложенные в Интернет данные
пока читает - нет проблемы, гугль их сто лет читает.
Но когда она начинает их выдавать за свое решение - возникают вопросы точно те же самые что и к человеку.Причем пострадать могут и владелец программы, и тот неудачник который скопипастил себе ее выхлоп.
Вот только вчера вышла новость что суд присудил что Anthropic не нарушает никаких прав. А всего лишь надо было купить бумажные книги официально. И если оцифровать книги и потом уничтожить физические копии и на них обучать нейросеть, то это всё ещё будет считаться
fair use.
Писец, теперь чтобы пару строк упоминания лицензии распарсить нужна сраная нейронка.
она же код вроде анализирует.А прикольно, если бы давала советы: Вот тут у вас "стыренный код", рекомендую внести изменения, чобы копирасты не смогли обвинить в плагиате и в нарушении лиценции. Вот вам Pull Request.
И всё. Никаких нарушений лицензии, а функционал сохранён. Как в GTA марки машин, примерно также переименовывали, чтобы их не засудили производители автомобилей. Или, как китайцы продают одежду под марками Abibas и Snike.
PS: и самое прикольное, что копирасты тоже будут использовать ИИ для выявления нарушений их авторского права. Так, что это борьба ИИ против ИИ.
> она же код вроде анализирует.
> А прикольно, если бы давала советы: Вот тут у вас "стыренный код",
> рекомендую внести изменения, чобы копирасты не смогли обвинить в плагиате и
> в нарушении лиценции. Вот вам Pull Request.не думаю что любая универсальная llm не даст тебе такой совет (ну только про стыреный код как-то завуалируй или хотя бы просто черточек и 13373 speak напихай, а то самоцензура не пропустит) - ты ж знаешь где у ТЕБЯ он стыреный.
Только этот пулреквест проверять все равно надо. Не бредятина ли там написана.
> И всё. Никаких нарушений лицензии, а функционал сохранён. Как в GTA марки
а вот второе как раз неточно. Как в gta. Там не про физику, там про бандитов.
Поэтому будешь писать юниттесты, та еще скука. А потом скармливать результат с ложечки искусственной идиотии в надежде что с третьего раза она все же сделает как надо.
Ну что тут сказать? Годно, нужно, молодцы 👏