Доброе время. Допустим есть большой каталог, где регулярно появляются текстовые файлы. В каждом файле есть ключевые строки. Допустим по этим строкам я хочу найти нужный мне файл. Но файлов реально много и find -f . * | xargs и т.д. будет реально отрабатывать долго. С помощью чего можно составить типа индекс файл, который будет обновляться при появлении новых файлов, бинарный и искать уже в нем? perl/python/bash etc. Заранее спасибо.
> Доброе время. Допустим есть большой каталог, где регулярно появляются текстовые файлы.
> В каждом файле есть ключевые строки. Допустим по этим строкам я
> хочу найти нужный мне файл. Но файлов реально много и find
> -f . * | xargs и т.д. будет реально отрабатывать
> долго. С помощью чего можно составить типа индекс файл, который будет
> обновляться при появлении новых файлов, бинарный и искать уже в нем?
> perl/python/bash etc. Заранее спасибо.Xapian https://ru.wikipedia.org/wiki/Xapian
На нём, например, сделан
+ почтовый клиент notmuch https://notmuchmail.org/
+ Recoll http://www.lesbonscomptes.com/recoll/ is a desktop full-text search tool.Продолжение осмотра
-> https://ru.wikipedia.org/wiki/%D0%9B%D0%...
-> https://ru.wikipedia.org/wiki/%D0%9F%D0%...
-> https://en.wikipedia.org/wiki/List_of_information_retrieval_...
> Но файлов реально много и find -f . * | xargs и т.д. будет реально отрабатывать долго.Silver searcher тебе в зубы :) Правдо оно без индексов ...
> Доброе время. Допустим есть большой каталог, где регулярно появляются текстовые файлы.
> В каждом файле есть ключевые строки. Допустим по этим строкам я
> хочу найти нужный мне файл. Но файлов реально много и find
> -f . * | xargs и т.д. будет реально отрабатывать
> долго. С помощью чего можно составить типа индекс файл, который будет
> обновляться при появлении новых файлов, бинарный и искать уже в нем?
> perl/python/bash etc. Заранее спасибо.man rgrep и не благодарите.
После первого прохода файлы отвиснут в кэше и следующие прогоны будут гораздо быстрее. Без всяких индексов.
> man rgrep и не благодарите.
> После первого прохода файлы отвиснут в кэше и следующие прогоны будут гораздо
> быстрее. Без всяких индексов.вот прям все 10-100кк файлов? о_О