GitHub представил проект CodeSearchNet, в рамках которого подготовлены модели машинного обучения и наборы данных, необходимые для разбора, классификации и анализа кода на различных языках программирования. CodeSearchNet, по аналогии с ImageNet, включает большую коллекцию отрывков кода, снабжённых аннотациями, формализующими выполняемые кодом действия. Компоненты для обучения моделей и примеры использования CodeSearchNet написаны на языке Python с использованием фреймворка Tensorflow и распространяется под лицензией MIT...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=51570
Покусились на святое -- StackOverflow!!11
Ждемс релиза без костылей
Шас придут ребята из PVS-Studio...
Это она, утилита для анализа кода ДНК-программиста(-ов)
> Это она, утилита для анализа кода ДНК-программиста(-ов)Нет, это IQ-тест.
Для анализа кода ДНК-программиста(-ов) достаточно спросить что у них за ОС на десктопе стоит.
У программистов с синдромом дауна стоит линукс?)
Не бывает программистов с синдромом дауна.
> Не бывает программистов с синдромом дауна.Ты хочешь сказать, что винду написали не програмисты?
Пишешь так как будто написал что-то лучше
синдром "сперва добейся" активэйтед
А на чём пишут ДНК-программисты?
На LaTeXе.
Аденин,гуанин, цитозин,тимин.
РНК-программисты урацил ещё юзают.
Спасибо автору за качественно написанную новость.
Ну не знаю, сейчас гитхаб не умеет даже склеить в выдаче поиска одинаковые файлы с разных репозиториев: когда ищешь какое-то популярное слово в кода выдаёт десятки страниц одного и того же файла наклонированного разными пользователями.
Им бы с этим разобраться...
Да, поиск на гитхабе - ужаснейшая вещь. То что они не борятся с дубликатами файлов - это половина проблемы. В поиске у них отображается максимум 50 страниц результатов. Учитывая дублирование, часто среди результатов поиска уникальными оказываются всего 3-4 результата.Еще для поисковика по коду, они удаляют все спецсимволы. Т.е. невозможно найти, напр., my_obj->size(10). Стрелка и скобки уберутся. 10, скорее всего тоже. И останется полная ерунда. Я, конечно, понимаю, что индексы не резиновые, но вы, блин, популярнейшее хранилище открытого кода. И по нему невозможно ничего найти.
Зачастую, гугл ищет по гитхабу лучше, чем сам гитхаб. Когда это происходит для сайта, который продает ботинки - это нормально. Но не для проекта такого уровня.
А разработчики херней страдают с нейронными сетями.
> А разработчики херней страдают с нейронными сетями.Э-э, "мы наконец-то пофиксили неработающий поиск" и "мы запилили нев*нно офигенную машиннообучаемую-нейро-<набор актуальных базвордов> для поиска" -- это в отчете перед начальством (или при пиаре) две большие разницы.
И вообще, PRщики радостно поддакивают -- машинлёрнинг из ин, а багофиксы особо упоминать как-то и неудобно.
Ну и вообще-то, в Редмонде вроде как было принято закрывать и фиксить только те баги, которые фиксить "выгодно" (т.е. которые иначе сказываются на "репутации" или возможности монитезации).
Nothing personal, just М$^W business ;)
TL;DR - не понял ничерта - что именно этот ИИ делать-то умеет, помимо рыться в чужих исходниках с непонятной целью?Или планирует уметь...
"Сири, что за херня тут написана и как, по мнению той обезьяны, должна была работать?!" - уже спросить можно?
42.
Да!
Скоро макака-стайл программирование будет таким "компьютер, запили мне такую программу для форума (вот его исходкики, запиленные тем же образом), чтобы сарказм детектировала, а если он направлен на модератора - бан выписывала автоматом и задеплой в k8s в виде микросервиса". И пофиг, что программа будет жрать терабайты, ведь это мечта хипстеров.
> И пофиг, что программа будет жрать терабайты, ведь это мечта хипстеров.и пофиг. Не пофиг что еще и работать нормально - не будет.
Когда пох болеет, ему всё пофиг.
Не жили хорошо, нечего и начинать — я правильно понимаю?