Исследователи из Университета Неймегена (Нидерланды) подготовили рейтинг открытости 40 больших языковых моделей и 7 моделей для генерации изображений по текстовому описанию, которые заявлены производителями как открытые. Из-за того, что критерии открытости моделей машинного обучения ещё только формируются, в настоящее время сложилась ситуация, когда под видом открытых распространяются модели, имеющие лицензию, ограничивающую область использования (например, многие модели запрещают применение в коммерческих проектах). Также часто производители не предоставляют доступ к используемым при обучении данным, не раскрывают детали реализации или не открывают полностью сопутствующий код...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=61448
Удивительно что самые продвинутые модели (ну или популярные, которые на слуху), не от гугла или яндекса; казалось бы, кто настоящий эксперт в краулинге и парсинге данных, по факту не стесняются использовать эти данные какие то стартапы и новички, а все эти корпорации сидят как драконы на куче золота и не хотят делиться. Видимо, еще предстоит увидеть здоровенную модель от какого нибудь гугла, которой скормили буквально весь инет.
Они ждут. Потом скупят стартапы с патентами и заработают ещё больше. А заодно конкурентов уберут. Капитализм он такой.
"все эти корпорации сидят как драконы на куче золота и не хотят делиться"В этом и смысл быть корпорацией. Скажите спасибо что у них еще корпоративной армии нет для выбивания неоплаченной подписки.
Скажите спасибо что у них еще корпоративной армии нет для выбивания **некупленной** подписки.
Да ну как же, традиции частных армий которые "уговаривают" фермеров освободить земли для строительства прогресса существуют уже несколько столетий в обители свободы и справедливостиА вот заставить купить подписку рандомного чела можно и без армии, - закрывать сервера с пиратскими копиями, пропихивать законы, нету да?
А вы автомобильную страховку не забыли оплатить и налоги в Социальный Фонд платите?
> корпоративной армии нет для выбивания неоплаченной подписки.Как нет? Армия лояров с удовольствием трахает пиратов оптом и в розницу - выписывая какие-то баснословные ущербы типа $100 000 за скачку пары треков.
А могли бы еще и прямо на дом тонтон-макутов присылать, вышибли дверь, выволокли на улицу, погрузили и повезли в офис продаж сделку оформлять.
> А могли бы еще и прямо на дом тонтон-макутов присылать, вышибли дверь,
> выволокли на улицу, погрузили и повезли в офис продаж сделку оформлять.Цивилизованый человек от нецивилизованного отличается тем что ограбит вас до последних трусов предельно вежливо и без всякого там насилия ;)
Похоже на особую трансформацию "всё есть воровство". Не всё есть воровство. Тебе могут впарить продукт, но потом может ещё спасибо скажешь
Что значит "может"? Ещё как скажешь, без всяких "может".
> самые продвинутые модели (ну или популярные, которые на слуху), не от гугла или яндекса;Они были достаточно жирные чтобы долго игнорить направление. А тут гугол спохватился и все же выкатил переделанный поиск на основе подобных моделей. А зачем им модель релизить? Чтобы бинг какой-нибудь сказал "спасибо!" и пошел конкурировать их же моделью? :)
Да и у гугли все подвязано на их инфраструктуру. Выложат они тебе свое - и чего дальше?
Это те же самые модели из списка просто с ярлычком
> Удивительно что самые продвинутые модели (ну или популярные, которые на слуху), не от гугла или яндекса;Видимо, не всё так здорово с ИИ, как это рисуют в новостях.
OpenAI последний по открытости. Жизнь лучше любого анекдота
Ну, песни про открытость в свое время принесли инвестиции. Но когда ребята стали на ноги, то среди них не нашлось дураков, стремящихся делиться миллиардами долларов
с конкурентами.
На самом деле начинали и поднимали OpenAI энтузиасты, а когда пошло бабло проснулись корпораты, которые решили сохранить поток бабла и все позакрывали.Упертых энтузиастов турнули, а те не дураки, и турнулись всей командой прямо в Майкрософт (гуглить Сэм Альтмен). Т.е. MS сначала стал инвестором OpenAI имея свою долю на несколько миллиардов, а потом, получается, утащил всех ключевых разработчиков прямо к себе за просто так.
Альтман никакой не энтузиаст, а прожжённый капиталист.
Так энтузиасты это Суцкевер и Маск. А Олтман как раз закрыл "ОпенАИ". Он и есть тот самый корпорат, который в итоге выгнал энтузиастов-основателей.
ChatGPTдно,а про него слышал больше чем про другие. Парадокс открытости.
Никакого парадокса. Уже пора бы понять, что все соцсети и медиа все существуют на деньги, получаемые от маркетологов. И даже когда сидишь на сайте для деревенских дурачков, все равно будешь читать рекламные проспекты в пересказе, потому что в головах у людей ничего просто так не появляется. Человек, способный что-то придумать - это буквально гений. Все остальные что-то пересказывают, а в худшем случае еще и перевирают на свой лад.
Он по открытости дно, а по качеству работы даже ГПТ версии 3.5 уделывает все остальные ГПТ модели.
Ничего gpt3.5 не уделывает, много моделей выглядт по лучше, вот 4 возможно.
> Ничего gpt3.5 не уделывает, много моделей выглядт по лучше, вот 4 возможно.Какие модели лучше, примеры в студию пожалуйста.
Про Gemini не говори, фуфло.
У Яндекса не плохой, пока тестирую и не могу сказать.
Какие ты знаешь в свободном доступе, которые были лучше ГПТ3,5?
Хороша модель Claude 3 от Anthropic, даже в самой простейшей редакции Haiku. ChatGPT 3.5 заметно хуже. Например, сравнил тестом на краткий пересказ Му-Му. Claude 3 Haiku вполне точно пересказал, а ChatGPT 3.5 Герасима девушкой назвал и добавил небылиц :-)
Спасибо. Мне он нравится. Буду изучать.
>Про Gemini не говори, фуфлоGemini 1.5 Pro попробуй; в Google AI Studio он бесплатный, если что. По качеству от gpt-4o его вряд ли даже отличишь, а по объёму контекста так вообще аналогов нет: может скармливать 700-страничные книги и почти часовые видосы, он как минимум неплохо их саммаризует.
>У Яндекса не плохойКхм, этот ведь тупой как пробка, о чём ты? Ни английского не знает, ни языков программирования, просто лаконичная говорилка.
>может скармливать 700-страничные книги и почти часовые видосыТолько увидел, что они сегодня увеличили контекстное окно с 1 до 2 миллионов токенов. Все предыдущие цифры можно удваивать. Восхитительно!
>>Про Gemini не говори, фуфло
> Gemini 1.5 Pro попробуй; в Google AI Studio он бесплатный, если что.
> По качеству от gpt-4o его вряд ли даже отличишь, а по
> объёму контекста так вообще аналогов нет: может скармливать 700-страничные книги и
> почти часовые видосы, он как минимум неплохо их саммаризует.Хм, спасибо, буду изучать. Люблю модельки тестить)
Тот гемини который не в студии дикая жесть, пользоваться нельзя.
>>У Яндекса не плохой
> Кхм, этот ведь тупой как пробка, о чём ты? Ни английского не
> знает, ни языков программирования, просто лаконичная говорилка.Не, попробуй console.yandex.cloud
Вполне хорошая моделька. Ответы дает отличные, на уровне гпт, следит за контекстом, знает языки программирования, дает лаконичные ответы без лищней воды как у ОпенАИ.
Тоже бесплатный. Но я только сегодня его нашел, еще не сильно тестировал. Так чисто вопросики позадавал.
Google AI Studio:
https://pasteboard.co/izrBRaE9ihZj.png
По рейтингу на https://arena.lmsys.org/ выше chatGPT-3.5 находится довольно много моделей, хотя там куча как бы почти повторяющихся подверсий. Там же можно беспллатно попробовать по сравнивать разные модели. Попробуй потестить сам.
А что, слабо сервачок поднять чтобы он всем на вопросы отвечал по любой теме?
Да ещё сделать так, чтобы о нём узнали?
Да.
Рейтинг показывает, что открытых моделй нет.
Надоели уже. Вся новостная лента состоит из этих языковых моделей, искусственных интеллектов и подобного мусора!
А что не мусор? Автор просто выклаывает мировые тренды. У него похоже нюх есть.
Хм.. что-то не увидел у OSI пункта "все данные использованные при обучении под лицензиями разрешающими переиспользование".
А то скормят картинки CC-ND и вясякот.
Дегенеративных AI-моделей.
Который в основном генерируют именно что булшит.
Вот здесь прекрасная статья на эту тему: https://link.springer.com/article/10.1007/s10676-024-09775-5
Вот по этому я и не пользуюсь функцией краткого изложения статьи в ЯБ.D Многое упустишь.
> Вот по этому я и не пользуюсь функцией краткого изложения статьи в ЯБ.D Многое упустишь.С вами говорил чатгоп... :)
Краткое изложение это как ревью на то что там, там не может быть полной информации.
Просто дает понять, надо тебе смотреть или нет.
> Который в основном генерируют именно что булшит.Тебя "автоматизировали" что ли? Откуда такая неприязнь?) А то вон чел писал тут парой тем назад, как они джунов позаменяли copilotом
Не, чтобы меня автоматизировать - пока даже естественного интеллекта не хватает.
> Не, чтобы меня автоматизировать - пока даже естественного интеллекта не хватает.А по постам на опеннете и не скажешь. Хотя возможно AI и правда не умеет заниматься только набиванием себе цены и руганью всех остальных. Но они научатся - и превзойдут вас. Так что когда искусственный мозг однажды посчитает тебя за слизняка и #$%нет большим тапком - ты знаешь кому сказать спасибо.
И да, речь там далеко не о неприязни. Речь о терминологии.
Если вдуматься - это _действительно_ буллшит. Выглядящее правдоподобным рандомное гонево.
Вот здесь только что наткнулся на феерический пример.https://lady-tiana.livejournal.com/1398347.html
Если это не булшит и дегенерация (причём это _приемлемые_ к такому выводу _термины_) - что это?
Не важно открытость, важно чтобы можно было давить цензуру и использовать бесплатно.
Эти модели как раз сами будут давить цензурой. Без открытости, данные для их обучения будут как раз подбирать с цензурой выгодной для их создателя.
Пока что самая адекватная модель которая совсем без цензуры это гугловский gemini 1.5 в google ai studio (там есть возможность ползунками полностью закрутить цензуру).
А они точно Stable Diffusion 3 смотрели? Там такая адовая лицензия, что всё сообщество пользователей взвыло - https://medium.com/@codingdudecom/sd3-license-9377f5dcfe57
FSF предложит AIGPL или без RMS они уже на такое не способны сподвигнуться?
Они и с ним неспособны. Это не имущественные права на код клянчить, не чужие сорцы тырить и лозунги голосить что всё должно быть "открыто" и "свободно".
Если столбец "Open code" не зелёный, то остальные можно даже не смотреть.
Можно подумать ты разберёшься в миллионах строчек чужого кода.
А где Gemini и Claude?
Нужно больше исследований исследований.
OpenAI сделали самую не-Open модель. Ироничненько
Какая-то очень ограниченная выборка, много всего нет.
> Какая-то очень ограниченная выборка, много всего нет.Там только модели, которые преподносятся как открытые.
Судя по таблице, код открыт только у пары тройки моделей, о которых никто не знает, кроме их разработчиков)