URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 117380
[ Назад ]

Исходное сообщение
"Microsoft открыл код библиотеки векторного поиска, используе..."

Отправлено opennews , 17-Май-19 11:35 
Компания Microsoft опубликовала (https://blogs.microsoft.com/ai/bing-vector-search/) исходные тексты библиотеки машинного обучения SPTAG (https://github.com/Microsoft/SPTAG) (Space Partition Tree And Graph) с реализацией алгоритма приблизительного поиска ближайшего соседа (https://ru.wikipedia.org/wiki/%D0%97%D0%.... Библиотека разработана (https://www.ailab.microsoft.com/vectorsearchexperiment) в исследовательском подразделении Microsoft Research и центре разработки поисковых технологий (Microsoft Search Technology Center).  На практике SPTAG применяется в поисковой системе Bing для определения наиболее релевантных результатов с учётом контекста поисковых запросов. Код написан на языке С++ и распространяется (https://github.com/Microsoft/SPTAG) под лицензией MIT. Поддерживается сборка для Linux и Windows.


Несмотря на то, что идеи применения векторных хранилищ в поисковых системах витают уже достаточно давно, на практике  их внедрению мешает большая ресурсоёмкость операций с векторами и ограничения в масштабируемости.  Совмещение методов глубинного машинного обучения с алгоритмами приблизительного поиска  ближайшего соседа позволило довести производительность и масштабируемость векторных систем до уровня, приемлемого для крупных поисковых систем. Например, в Bing для векторного индекса размером более 150 миллиардов векторов время выборки наиболее релевантных результатов укладывается в 8 мс.

В состав библиотеки включены средства для построения индекса и организации поиска векторов, а также набор инструментов для сопровождения распределённой системы online-поиска, охватывающей очень большие коллекции векторов. Предлагается два основных модуля: index builder для индексации  и searcher для поиска с использованием индекса, распределённого в кластере из нескольких узлов. Поддерживается включение новых векторов в индекс и удаление векторов на лету.


Библиотека подразумевает, что обрабатываемые и представленные в коллекции данные оформлены в виде связанных векторов, которые можно сравнивать на основе евклидовых (https://ru.wikipedia.org/wiki/%D0%95%D0%... (L2) или косинусных (https://ru.wikipedia.org/wiki/%D0%9A%D0%... расстояний. При поисковом запросе возвращаются векторы, расстояние между которыми и исходным вектором минимально. В SPTAG предоставляется два метода организации векторного пространства: SPTAG-KDT (K-мерное дерево (kd-tree (https://ru.wikipedia.org/wiki/K-%D0%BC%D0... и граф относительных окрестностей (https://ru.wikipedia.org/wiki/%D0%93%D1%... и SPTAG-BKT (дерево k-средних (k-means tree (https://ru.wikipedia.org/wiki/%D0%9C%D0%... и граф относительных окрестностей). Первый метод требует меньше ресурсов при работе с индексом, а второй демонстрирует более высокую точность результатов поиска при очень больших коллекциях векторов.


При этом векторный поиск не ограничивается текстом и  может применяться к мультимедийной информации и изображениям, а также для в системах автоматического формирования рекомендаций. Например, в одном из прототипов на базе фреймворка PyTorch была реализована векторная система для поиска с учётом сходства объектов на изображениях, построенная с использованием данных из нескольких эталонных коллекций с изображениями животных, кошек и собак, которые были преобразованы в наборы векторов. При поступлении входящего изображения для поиска оно преобразуется с использованием модели машинного обучения в вектор, на основе которого при помощи алгоритма SPTAG из индекса выбираются  наиболее похожие векторы и как результат возвращаются связанные с ними изображения.

URL: https://blogs.microsoft.com/ai/bing-vector-search/
Новость: https://www.opennet.dev/opennews/art.shtml?num=50698


Содержание

Сообщения в этом обсуждении
"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено InuYasha , 17-Май-19 11:35 
Поскольку M$ трудно обвинить в альтруизме, можно предроложть, что им потребовался аутсорс на поиск ошибок :)

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 11:41 
Можно сразу опередить всех умников и сразу написать EEE.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 14:12 
Ненужная библиотека ненужного поиска, который ищет хуже, чем Duckduckgo.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено донни , 17-Май-19 16:41 
Какой поисковик лучший?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено fske , 17-Май-19 17:14 
По каким критериям?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Канделябры , 17-Май-19 19:43 
Гугл. К сожалению. По любым критериям.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Anonymouss , 17-Май-19 20:11 
Спорно. рускоязычный контент таки яндекс лучше индексирует.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 23:31 
По хабру и жж гугл норм ищет. А какой ещё бывает полезный русскоязычный контент в сети?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 18-Май-19 10:12 
Стыдно такое писать на опеннете

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 18-Май-19 20:46 
Так по опеннету гугл тоже лучше яндекса ищет.

Какие еще остались варианты полезных сайтов рунета?


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено X86 , 21-Май-19 05:24 
Только что проверил поиск по фразе:
"Так по опеннету гугл тоже лучше яндекса ищет.
Какие еще остались варианты полезных сайтов рунета?"

и ее нашел здесь только Яндекс. Гугл не нашел. Получается, по опеннету лучше Яндекс ищет.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 20-Май-19 21:49 
Русскоязычный контент? Глупее выражения трудно придумать.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 18-Май-19 14:45 
Никакой )

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Канделябры , 17-Май-19 19:42 
А что, бывает поиск ещё хуже чем у утки? Но это точно не про Bing.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено anon4334 , 17-Май-19 19:59 
этот ваш ненужный поиск используется в Duckduckgo "DuckDuckGo's results are a compilation of "over 400" sources,[15] including Yahoo! Search BOSS; Wolfram Alpha; Bing; Yandex; its own Web crawler (the DuckDuckBot); and others.[4][15][16][17] It also uses data from crowdsourced sites, including Wikipedia, to populate knowledge panel boxes to the right of the results.[17]" https://en.wikipedia.org/wiki/DuckDuckGo

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено OpenEcho , 18-Май-19 15:58 
я уж забыл когда последний раз видел в логах DuckDuckBot

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 19-Май-19 09:22 
DuckDuckGo ничего не ищет. Он просто проксирует результаты из Bing.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено xm , 22-Май-19 19:29 
Умные...

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено нах , 17-Май-19 15:37 
> Поскольку M$ трудно обвинить в альтруизме, можно предроложть, что им потребовался аутсорс
> на поиск ошибок :)

скорее можно предположить что бинг отправится следом за йожом :-(

видимо, в новом хромойоже поменять дефолтный поисковик индусы не справились


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Joac , 17-Май-19 15:49 
насколько я знаю ддг ище на инглише как правило опираясь на бинг

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 16:42 
> насколько я знаю ддг ище на инглише как правило опираясь на бинг

ну будет искать, опираясь на яндекс, по слухам, оттуда давно уже берется большая часть его содержимого.



"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 19:09 
Вполне возможно, что просто перешли на что-то новое, существенно лучшее, а это выкинули в качестве дезинформации для тех, кто сам исследованиями не занимается. Удобно же, потенциальные конкуренты сидят на старье и уверены, что у них всё как у М$

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 23:02 
вообще-то гораздо удобнее, когда потенциальные клиенты покупают ключи для api, а данные хранит гугл...зачеркнуто, MS.
И никакого кода никому не давать, даже устаревшего.

Но корпорация - зла.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 11:40 
Потому что нафиг эта либа никому не упёрлась.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Ordu , 17-Май-19 21:01 
А мне нравится. Прикольно было бы в засунуть в WorldBrain's Memex[1], чтобы искать по истории с учётом семантики, а не тупо по регекспам.

[1] https://worldbrain.helprace.com/


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 23:33 
Что это за штука и что она делает?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Ordu , 18-Май-19 02:15 
> Что это за штука и что она делает?

Историю браузера индексирует. Не только заголовки и теги, но ещё и содержимое страниц. Позволяет искать по истории всякими интересными запросами, а не так как это по дефолту сделано убого. Короче круть несусветная.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 18-Май-19 22:29 
> Что это за штука и что она делает?

правильный линк - lmgfy:memex...зачеркнуто, https://worldbrain.io/

ну и как обычно - работает в последнем-распоследнем хроме, хроме, хроме, и еще иногда и с глюками в распоследнем фуфлофоксе из-за любви к нескучным js тулкитам, разумеется, самых распоследних версий. (Попутно сливает массу инфы о юзвере - как обещается, отключаемо. Впрочем, нескучные тулкиты и нагромождение зависимостей не оставляют возможности это действительно проверить.)
По этой же причине с ms'овской поделкой ее связать не получится, у той нет нескучного npm модуля.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 11:46 
Гипертекстового?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Попугай Кеша , 17-Май-19 12:06 
Даже не представляю, что должно случиться с человеком, что произойти в жизни, чтобы он в этом стал копаться, разбираться?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 12:13 
ну, например, человеку может захотеться нормального поиска по собственным серверам, не сливающего данные дяде и не зависящего от канала в сторону дяди.

И при этом у него может найтись на это время, вдохновение, и кое-какое образование.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Ключевский , 17-Май-19 12:25 
Такой человек пойдет https://sphinxsearch.com/ сюда и обретет там счастья полные штаны

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено IRASoldier , 17-Май-19 12:47 
А еще более такой человек сравнит разные методологии и архитектуры, а значит - пойдёт не только по одной ссылке.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 14:23 
ну я же вроде сказал про образование...
как минимум позволяющее отличить примитивный индексатор с поиском по побуквенным совпадениям от нечеткого поиска с самообучающимся алгоритмом, умеющим отличить картинку кошки от собаки.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Ключевский , 17-Май-19 15:46 
> ну я же вроде сказал про образование...
> как минимум позволяющее отличить примитивный индексатор с поиском по побуквенным совпадениям
> от нечеткого поиска с самообучающимся алгоритмом, умеющим отличить картинку кошки от
> собаки.

Ну и расскажи про примитивный индексатор с поиском по буквам в поиски википедии, а над тобой поржет весь опеннет


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 15:52 
> Ну и расскажи про примитивный индексатор с поиском по буквам в поиски
> википедии, а над тобой поржет весь опеннет

!
(это палец, поржи)

P.S. в викивракии именно примитивный индексатор с поиском по буквам - найти не может ничего и никогда, кроме такого, что проще "искать" прямо в строке url
Впрочем, я охотно поверю, что альтернативно-одаренные опеннетчики поржут, поскольку никогда им не пользовались, но свято верят в чудо.

https://vectorsearch.azurewebsites.net/ - для ниасиливших прочитать по английски.
конечно же, для викивракии это давно пройденый этап, она читает мысли прямо из головы.



"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено sena , 17-Май-19 15:22 
Написано "open source" и нет ссылки на исходники. В загрузках предлагают скачать бинарники. Морды своей, я так понял нет, нужно где-то искать?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 15:44 
> Написано "open source" и нет ссылки на исходники.

у вас очки запотели - меньше др..те на лошадок в интернетах. Возможно, сумеете после этого расслеповать репо на гитхабе.

> В загрузках предлагают скачать
> бинарники. Морды своей, я так понял нет, нужно где-то искать?

это низкоуровневая библиотека векторного поиска. Ее можно использовать в своем индексаторе, ага, когда и если ты его напишешь.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено sena , 17-Май-19 17:37 
>> Написано "open source" и нет ссылки на исходники.
> у вас очки запотели - меньше др..те на лошадок в интернетах. Возможно,
> сумеете после этого расслеповать репо на гитхабе.

Это что-ли?

3.0 and up sources are currently only available under a delayed FOSS or commercial licenses for several reasons; going back to regular plain old GPL is planned but timing is moot; so email us if you require the sources immediately.

>> В загрузках предлагают скачать
>> бинарники. Морды своей, я так понял нет, нужно где-то искать?
> это низкоуровневая библиотека векторного поиска. Ее можно использовать в своем индексаторе,
> ага, когда и если ты его напишешь.

То есть нет не только морды, но и краулера?


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 18:57 
Вы что издеваетесь?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 22:59 
это я издеваюсь, а он реально не понимает.

P.S. а меж тем там уже пачка issues и пара дельных pull-requests, то есть подальше от опеннета находятся те, кто не только понимают, но, похоже, всерьез намерены пользоваться. Эх...где мой безусловный доход?


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 18:57 
> Это что-ли?

еще меньше др..м на лошадок, и очки промойте - вы их, похоже, забрызгали и оно там присохло, а к нему прилипла газета Красная Звезда, кою вы и читаете.
Потому что в SPTAG нет никаких версий "3.0"

> То есть нет не только морды, но и краулера?

какого в $опу краулера? Оно не про веб вообще.
Оно про поиск векторов, голая математика.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено sena , 18-Май-19 15:47 
>> Это что-ли?
> еще меньше др..м на лошадок, и очки промойте - вы их, похоже,
> забрызгали и оно там присохло, а к нему прилипла газета Красная
> Звезда, кою вы и читаете.
> Потому что в SPTAG нет никаких версий "3.0"

При чём тут SPTAG? Ты хоть почитай о чём ветка обсуждения. А то выходит живая иллюстрация к бревну в чужом глазу :)


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 18-Май-19 18:48 
> При чём тут SPTAG? Ты хоть почитай о чём ветка обсуждения. А

а, так ты о свинксе? Я думал, эту тему мы сразу проехали, ненужное ненужно.

Надо ж. Я им не интересовался лет с десяток, а они за это время, оказывается, совсем кукухой уехали от успехов.
Но нет, веб-crawler к нему отродясь не прилагался, эта хрень для поисков по своей собственной, ни с чем несовместимой базе, наполнять которую надо самому, уж как сумеешь.

в отличие от ms'овской поделки, база просто текстовая, поэтому применить в домашнем хозяйстве раньше было вполне можно, без особых прыжков и приседаний со вспоминанием курса линейной алгебры и чего там еще.
Но ненужно - современный sqlite'овый fts и побыстрее будет, и более предсказуем.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Michael Shigorin , 17-Май-19 17:27 
Мне для такого хватало xapian+omega (ну ладно, и ещё немножко рукоприкладства -- жаль только, не выложил никуда).

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 17:46 
В чем проблема выложить? Если просуммировать время на написание всех комментов, где ты сокрушаешься о невыкладывании, -- получится больше, чем время на публикацию своего "рукоприкладства".

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Michael Shigorin , 17-Май-19 19:07 
> В чем проблема выложить?

Сделано было лет десять назад, те машины offline уже лет пять, сохранились ли диски или копии -- не знаю.  Сам локти грызу, а переизобретать колёсико пока лень.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено forum reader , 17-Май-19 23:09 
то же, что заставляет копаться в любом опенсорсе?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 12:42 
> Код написан на языке С++ и распространяется под лицензией MIT.

Нет ведь написать на чистом Си и распространять под GPLv3+.
EEE и корпоративные грязные приемы во все поля.
Спасибо, не нужно.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено IRASoldier , 17-Май-19 12:46 
Дарёному коню в лицензию не смотрят.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Andrey Mitrofanov , 17-Май-19 12:54 
> Дарёному коню в лицензию не смотрят.

А ведь и точно!  Троянскому коню -- сразу на авторстве разворот от ворот.

"Микрософт открыл", "Интел выпустил", "Оракл пофиксил"...  [I]Охохонюшки, опенетушки...


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено IRASoldier , 17-Май-19 13:28 
>Троянскому коню

Давай, расскажи нам, код какого трояна ты нашёл в этой майкрософтовской библиотеке.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Andrey Mitrofanov , 17-Май-19 13:49 
>>Троянскому коню
> Давай, расскажи нам, код какого трояна ты нашёл в этой майкрософтовской библиотеке.

Ты плохо помнишь сказку про Трою?

"Нашли"-то как раз те, что открыли ворота и втащили.

Та-а-а-шта...  ты нам расскажи -- как оно...  "там".


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено IRASoldier , 17-Май-19 14:06 
Мне вот интересно - ты дурачка строишь или таки взаправду? Повторяю вопрос: какой вредоносный или потенциально вредоносный код ты обнаружил в библиотеке из новости?


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 14:14 
Я скачал код - там в некоторых местах обнаружил замаскированный EEE (я знаю C++ если что). Опенсорсному сообществу надо быть на чеку.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено IRASoldier , 17-Май-19 14:35 
> (я знаю C++ если что). Опенсорсному сообществу надо быть на чеку.

Ага, "не всё так просто, я дочь офицера".



"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 17:31 
Ну ты и спалился, солдат ;)

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Andrey Mitrofanov , 17-Май-19 14:22 
> Мне вот интересно - ты дурачка строишь или таки взаправду? Повторяю вопрос:

Не больше, чем ты.

> какой вредоносный или потенциально вредоносный код ты обнаружил в библиотеке из
> новости?

Повторяю ответ. В заголовке ж.  Новости.  С первого раза не понятно.  Почему.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено IRASoldier , 17-Май-19 14:34 
> Повторяю ответ. В заголовке ж.  Новости.  С первого раза не
> понятно.  Почему.

Потому что в заголовке новости ничего не сказано про троянских коней или ещё каких-то сферических лошадок в вакууме, подсказывает Кэп.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено виндотролль , 17-Май-19 21:14 
Перед началом дискуссии на опеннете рекомендую читать ник собеседника.

Посмею предположить, что ваш вопрос остался вашим собеседником непонятым, потому что ответ — взаправду.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено rioko , 17-Май-19 13:31 
Давайте сразу признаем что ищет BIng так себе )

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 13:39 
Зато у него все шаги записаны.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Ключевский , 17-Май-19 13:55 
> Давайте сразу признаем что ищет BIng так себе )

А он вообще что-то ищет?
Помнится я как-то пытался им искать, у меня создалось впечатление, что он не ищет что-то в сети, а показывает ссылки на рандомные сайты в надежде угадать :-D


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 14:26 
> А он вообще что-то ищет?

секс с конями мне ни разу не находил.

так что да, ищет, а не подбирает подходящее по истории твоей веб-активности. Видимо, у ms (по крайней мере - моей) нет.

P.S. а еще у него картинки


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Ключевский , 17-Май-19 15:48 
>> А он вообще что-то ищет?
> секс с конями мне ни разу не находил.
> так что да, ищет, а не подбирает подходящее по истории твоей веб-активности.
> Видимо, у ms (по крайней мере - моей) нет.
> P.S. а еще у него картинки

Ну секс с конями я не пробовал искать ни там, ни в гугле, ни альтависте. Как-то мне не нужно.
А вот когда пробовал искать по делу он искал ну чуть лучше покойного спутника.

А поиск по картинкам очень качественный есть у гугла и яндекса, узнай же это.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 16:05 
> Ну секс с конями я не пробовал искать ни там, ни в
> гугле, ни альтависте. Как-то мне не нужно.

а я вот пробовал - регулярно и старательно. И теперь даже если набираю "алгоритмы векторного поиска" - в пару кликов вылезают лошадки (что и было целью, если еще не дошло). Что как бы говорит нам о том, как именно работает "поиск" гугля последние десять лет. До 2008го - да, было лучше.

Разумеется, я могу его обмануть, но в этих случаях релевантность поиска сравнима нынче уже с duck-duck - зачем улучшать алгоритмы поиска, когда можно вместо этого улучшать алгоритмы слежки?

> А поиск по картинкам очень качественный есть у гугла и яндекса, узнай

я рад за гугля с яндексом, но вам же сказали - эта либа - для тех кто сам себе хочет быть гугляндексом (и готов на это потратиться, поскольку там нет готового). А вы притащили корявого свинкса, который только сегфолтиться хорошо умеет.

Кстати, возможно, яндексу и пригодится - его "очень качественный" лажает на элементарных вещах (сунул ему первую попавшуюся фотку с дачи, чисто поржать - нет, за последние годы лучше не стало. У гугля стало. Кстати, ЭТОТ поиск результаты слежки, видимо, не использует, про дачу гугль знает.)
хотя скорее всего лажает от того что обучать ленятся, а не от того что алгоритм плох.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Sw00p aka Jerom , 17-Май-19 17:08 
не вижу описание алгоритмической сложности сего поделия, ткните, ну или бенчмарки какие-нить

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 18:47 
э... бенчмарки - чего? говорят тебе - это библиотека. Ты ей вектор, она тебе - "похожий".
Можно было бы сравнивать с другими библиотеками векторного поиска, на одном и том же массиве данных, если бы они у тебя были.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Sw00p aka Jerom , 17-Май-19 18:54 
> э... бенчмарки - чего? говорят тебе - это библиотека.

"""
В состав библиотеки включены средства для построения индекса и организации поиска векторов, а также набор инструментов для сопровождения распределённой системы online-поиска, охватывающей очень большие коллекции векторов.
"""

Ну если считать это бенчмарком

"""
Например, в Bing для векторного индекса размером более 150 миллиардов векторов время выборки наиболее релевантных результатов укладывается в 8 мс.
"""

Допустим это для поиска, а для индексации "150 миллиардов векторов" сколько времени уйдет?


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 19:02 
> В состав библиотеки включены средства для построения индекса и организации поиска векторов

ну. У тебя есть какая-то более другая библиотека для поиска векторов и набор этих самых векторов для построения индекса?

> Допустим это для поиска, а для индексации "150 миллиардов векторов" сколько времени уйдет?

ну уж всяко меньше чем найти данные и построить по ним эти 150 миллиардов векторов. Правда, кто-то жаловался, что обломался о лимит 4g, но, возможно, просто не надо их пихать индексатору за раз.

Ты бы хоть код глянул, что-ли - там вполне человекочитаемые примеры на, тьфу, пихоне.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Sw00p aka Jerom , 17-Май-19 19:23 
>ну. У тебя есть какая-то более другая библиотека для поиска векторов и набор этих самых векторов для построения индекса?

а почему нет? алгоритмы известны. И в случае с МС, ничего нового тут нету.

> Ты бы хоть код глянул, что-ли - там вполне человекочитаемые примеры на, тьфу, пихоне.

а зачем? если есть ссылки на вики

к примеру https://ru.wikipedia.org/wiki/K-%D0%BC%D0...

"""
Из этого можно сделать вывод, что чем больше элементов будет содержаться в узле, тем быстрее будет проходить поиск по дереву, так как высота дерева будет оставаться минимальной, однако не следует хранить огромное количество элементов в узле, так как при таком способе всё дерево может выродиться в обычный массив или список.
"""

Там дальше в разделе "Поиск ближайшего соседа" описана сложность.

Ну и собственно свои плюсы-минусы

"""
Первый метод требует меньше ресурсов при работе с индексом, а второй демонстрирует более высокую точность результатов поиска при очень больших коллекциях векторов.
"""



"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 22:56 
> а почему нет? алгоритмы известны. И в случае с МС, ничего нового тут нету.

откуда ж я знаю, почему у тебя ее нет. У MS вот, оказываетсо, есть. Ничего нового - начать и кончить, ага.

Будем ждать пока и векторы нам ms подарит, или сами писать пойдем? Вот и я тоже думаю...


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Sw00p aka Jerom , 18-Май-19 00:16 
> Будем ждать пока и векторы нам ms подарит, или сами писать пойдем?
> Вот и я тоже думаю...

https://en.wikipedia.org/wiki/K-d_tree

раздел Open source implementations, есть и их куча, все кому не лень её писали



"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 18-Май-19 22:32 
> раздел Open source implementations, есть и их куча, все кому не лень

видимо, так написали, что пользы никому от них никакой.

А из этой ms умудрилась собрать бинг, что как бе намекает.

Дальше можно заниматься схоластикой, и писать синтетические тесты для неведомой хрени, найденой в википедии. Можно вместо этого придумывать, как представить доступный тебе набор информации векторами и потихоньку писать замену тому же свинксу.

А я пойду собачку погуляю, пожалуй. К счастью, для этого не нужна ни одна модная технология моложе XIX века.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 17:47 
Потому и библиотека халявная.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 19:01 
А вы у у гугла без истории поиска поищите результат примерно тот же будет что и у бинг. Вот до чего терпеть не могу m$, но поиск в целом нормальный.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 19:04 
тут, конечно, еще вопрос, история чего есть у bing.
С учетом search suggestions и не только.

(нет, не предлагайте мне кормить его конями и понями, это надо несколько лет к ряду делать, чтобы результат увидеть, у меня давным-давно нет столько времени)



"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 17-Май-19 20:41 
обвязка есть, а надстройку сделать забыли?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 17-Май-19 22:54 
не забыли, bing называетсо.
Исходники зажали, это да. Ну чо ты хошь, корпорация - зла!

(я сегодня читал про особенности администрежа windows core через, блжад - ssh - плакал. Такое и впрямь только от большого зла можно наколбасить. И кто тут нынче пуссиэкзешники?)


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 18-Май-19 13:31 
От Майкрософт нам ничего не нужно.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено alexschka , 18-Май-19 21:11 
У них денег много, стимулируют почёсывая гениталии того кто при делах и устроят как им нужно... А многочисленные проплаченные хомячки дружно одобрят "не сектантсквое" начинание, а адепты млкомягкой кроссплатформенности начнут выть как это прекрасно и всем пингвино юзающим полезно!

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено пох , 18-Май-19 22:33 
> От Майкрософт нам ничего не нужно.

вы - ненужно.


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 23-Май-19 11:32 
тема хоть и нишевая но очень острая. Приблизительное сравнение множеств с неограниченным числом вариантов за фиксированное время из области не решаемого.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено ALex_hha , 18-Май-19 14:24 
А что, кто-то пользуется бингом для поиска? о_О

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено alexschka , 18-Май-19 21:01 
Дарёному ослику под хвост не заглядывают?

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено MSDOS 6.22 , 19-Май-19 07:36 
Да, я пользуюсь Бингом.
Его игнорируют SEO оптимизаторы, поэтому он ищет лучше Гугла.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено KonstantinB , 20-Май-19 16:17 
Хреново он ищет. Точнее, неверно расставляет приоритеты.
Гугл первым ставит официальные мануалы, бинг же - не всегда, но часто - всякие stackoverflow.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено MSDOS 6.22 , 20-Май-19 20:52 
Где лежат официальные мануалы и так известно без Гугла.
А редкие специфические вещи Бинг находит лучше Гугла и Яндекса.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено KonstantinB , 20-Май-19 21:48 
Ну и что, что известно? Написать в поисковой строке браузера что-то вроде "javascript reduce" и сходить по первой ссылке все равно быстрее.

Редкие специфичные - хм, это какие? Где-то слышал, что Bing порнуху ищет лучше :-)


"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено MSDOS 6.22 , 20-Май-19 22:23 
Про порнуху не в курсе, но как то раз захотелось перечитать одну статью по специфической эзотерической практике. Оказалось, что сайт исчез в месте со статьей и на archive.org ее нет.
Должна же быть где-то копия на просторах инета?
Гугл меня упорно держал в поисковом пузыре. Искуственный интеллект предлагал, что по его мнению ищут обычные люди по подобным словам. По ссылкам все, что угодно, кроме копии статьи.
Яндекс тоже не смог ничего найти.
А Бинг нашел сразу на первой странице выдачи и копии статьи и обсуждения статьи на форумах.
После этого случая я Бинг зауважал.

"Microsoft открыл код библиотеки векторного поиска, используе..."
Отправлено Аноним , 21-Май-19 11:12 
Порнуху тоже. В целом это удивительно, но он зачастую успешней других находит релевантные _нужные_ результаты. А из гугла просто всё удаляют, там ничего не ищется, как ни начнёшь искать что-то конкрентное.