файлах - Как найти все файлы, содержащие определенный текст в Linux?




поиск текста в файлах linux (20)

Я пытаюсь найти способ сканирования всей системы Linux для всех файлов, содержащих определенную строку текста. Чтобы уточнить, я ищу текст в файле, а не в имени файла.

Когда я смотрел, как это сделать, я дважды сталкивался с этим решением:

find / -type f -exec grep -H 'text-to-find-here' {} \;

Однако это не работает. Кажется, он отображает каждый файл в системе.

Это близко к правильному способу сделать это? Если нет, как мне? Эта возможность находить текстовые строки в файлах будет чрезвычайно полезна для некоторых проектов программирования, которые я делаю.


Как найти все файлы, содержащие определенный текст в Linux? (...)

Я наткнулся на это решение дважды:

find / -type f -exec grep -H 'text-to-find-here' {} \;

Если вы используете find в вашем примере, лучше добавьте -s ( --no-messages ) в grep и 2>/dev/null в конце команды, чтобы избежать много сообщений о grep выданных grep и find :

find / -type f -exec grep -sH 'text-to-find-here' {} \; 2>/dev/null

find - стандартный инструмент для поиска файлов - в сочетании с grep при поиске определенного текста - на Unix-подобных платформах. xargs , команда find часто сочетается с xargs .

Для этой же цели существуют более быстрые и простые инструменты - см. Ниже. Лучше попробуйте их, если они доступны на вашей платформе , конечно:

Более быстрые и простые альтернативы

ripgrep - быстрый инструмент поиска:

rg 'text-to-find-here' / -l

Серебряный Искатель :

ag 'text-to-find-here' / -l

ack :

ack 'text-to-find-here' / -l

Примечание. Вы также можете добавить 2>/dev/null к этим командам, чтобы скрыть много сообщений об ошибках.

Предупреждение : если вы действительно не можете этого избежать, не выполняйте поиск из '/' (корневого каталога), чтобы избежать длительного и неэффективного поиска! Поэтому в приведенных выше примерах вам лучше заменить « / » на имя подкаталога, например «/ home», в зависимости от того, где вы действительно хотите выполнить поиск ...


Список имен файлов, содержащих заданный текст

Прежде всего, я считаю, что вы использовали -H вместо -l . Также вы можете попробовать добавить текст внутри кавычек, а затем {} \ .

find / -type f -exec grep -l "text-to-find-here" {} \; 

пример

Предположим, вы ищете файлы, содержащие определенный текст «Apache License» внутри вашего каталога. Он отобразит результаты, несколько похожие на ниже (вывод будет отличаться в зависимости от содержимого вашего каталога).

bash-4.1$ find . -type f -exec grep -l "Apache License" {} \; 
./net/java/jvnet-parent/5/jvnet-parent-5.pom
./commons-cli/commons-cli/1.3.1/commons-cli-1.3.1.pom
./io/swagger/swagger-project/1.5.10/swagger-project-1.5.10.pom
./io/netty/netty-transport/4.1.7.Final/netty-transport-4.1.7.Final.pom
./commons-codec/commons-codec/1.9/commons-codec-1.9.pom
./commons-io/commons-io/2.4/commons-io-2.4.pom
bash-4.1$ 

Устранение чувствительности к регистру

Даже если вы не используете такой случай, как «текст» и «ТЕКСТ», вы можете использовать ключ -i чтобы игнорировать регистр. Здесь вы можете прочитать дополнительную информацию.

Надеюсь, это вам поможет.



grep - ваш хороший друг, чтобы достичь этого.

grep -r <text_fo_find> <directory>

если вам не нужен случай поиска текста, то используйте

grep -ir <text_to_find> <directory>

Вы можете использовать ack . Это похоже на grep для исходного кода. Вы можете просмотреть всю свою файловую систему.

Просто делать:

ack 'text-to-find-here'

В корневом каталоге.

Вы также можете использовать регулярные выражения , указать тип файла и т. Д.

ОБНОВИТЬ

Я только что открыл Silver Searcher , который похож на ack, но на 3-5 раз быстрее, чем он, и даже игнорирует шаблоны из файла .gitignore .


Вы можете использовать grep -ilR :

grep -Ril "text-to-find-here" /
  • i означает случай игнорирования (необязательно в вашем случае).
  • R означает рекурсивный.
  • l означает «показать имя файла, а не сам результат».
  • / означает начало в корне вашей машины.

Выполните следующие действия:

grep -rnw '/path/to/somewhere/' -e 'pattern'
  • -r или -R является рекурсивным,
  • -n - номер строки, и
  • -w означает совпадение всего слова.
  • -l (нижний регистр L) можно добавить, чтобы просто указать имя файла совпадающих файлов.

Наряду с ними флаги --exclude , --include , --exclude-dir могут использоваться для эффективного поиска:

  • Это будет искать только те файлы, у которых есть .c или .h расширения:

    grep --include=\*.{c,h} -rnw '/path/to/somewhere/' -e "pattern"
    
  • Это исключает поиск всех файлов, заканчивающихся расширением .o:

    grep --exclude=*.o -rnw '/path/to/somewhere/' -e "pattern"
    
  • Для каталогов можно исключить конкретный каталог (ы) через параметр --exclude-dir . Например, это исключает dir1 /, dir2 / dir2 и все из них, соответствующие * .dst /:

    grep --exclude-dir={dir1,dir2,*.dst} -rnw '/path/to/somewhere/' -e "pattern"
    

Это очень хорошо для меня, для достижения почти той же цели, что и ваша.

Для получения дополнительных параметров проверьте man grep .


Если ваш grep не поддерживает рекурсивный поиск, вы можете комбинировать find с xargs :

find / -type f | xargs grep 'text-to-find-here'

Мне это легче запомнить, чем формат find -exec .

Это приведет к отображению имени файла и содержимого соответствующей строки, например

/home/rob/file:text-to-find-here

Дополнительные флаги, которые вы можете добавить в grep :

  • -i case -чувствительный поиск
  • -l - выводить только имя файла, в котором было найдено совпадение
  • -h - выводить только строку, которая соответствует (а не имя файла)

Использование:

grep -c Your_Pattern *

Это сообщит, сколько копий вашего шаблона присутствует в каждом из файлов в текущем каталоге.


Используйте pwd для поиска из любого каталога, в котором вы находитесь, рекурсивный вниз

grep -rnw `pwd` -e "pattern"

Обновление. В зависимости от используемой вами версии grep вы можете опустить pwd . О новых версиях . представляется по умолчанию для grep, если каталог не указан таким образом:

grep -rnw -e "pattern"

или же

grep -rnw "pattern"

будет делать то же, что и выше!


Меня увлекает то, как простой grep делает это с 'rl'

grep -rl 'pattern_to_find' /path/where/to/find

-r to find recursively file / directory inside directories..
-l to list files matching the 'pattern'

Используйте '-r' без 'l', чтобы увидеть имена файлов, за которыми следует текст, в котором найден шаблон !

grep -r 'pattern_to_find' /path/where/to/find

Работает просто отлично ..

Надеюсь, поможет!


Надеюсь, это поможет ...

Развернув grep немного, чтобы дать больше информации на выходе, например, чтобы получить номер строки в файле, где текст можно сделать следующим образом:

find . -type f -name "*.*" -print0 | xargs --null grep --with-filename --line-number --no-messages --color --ignore-case "searthtext"

И если у вас есть представление о типе файла, вы можете сузить свой поиск, указав расширения типа файла для поиска, в этом случае .pas OR .dfm files:

find . -type f \( -name "*.pas" -o -name "*.dfm" \) -print0 | xargs --null grep --with-filename --line-number --no-messages --color --ignore-case "searchtext"

Краткое описание вариантов:

  1. . в find указывает из текущего каталога.
  2. -name " *.* ": для всех файлов (-name " *.pas " -o -name " *.dfm "): Только файлы *.pas OR *.dfm , или указанные с -o
  3. -type f указывает, что вы ищете файлы
  4. -print0 и --null на другой стороне | (pipe) являются ключевыми, передавая имя файла из find в grep встроенное в xargs , позволяя пропускать имена файлов WITH пробелов в именах файлов, позволяя grep обрабатывать путь и имя файла как одну строку, а не прерывать его на каждом пространстве.

Попробуй это:

find . | xargs grep 'word' -sl

Появилась новая утилита под названием The Silversearcher

sudo apt install silversearcher-ag

Он тесно работает с Git и другими VCS. Таким образом, вы не получите ничего в .git или другом каталоге.

Вы можете просто использовать

ag -ia "Search query"

И он выполнит эту задачу для вас!


Пытаться:

find . -name "*.txt" | xargs grep -i "text_pattern"

Пытаться:

find / -type f -exec grep -H 'text-to-find-here' {} \;

который будет искать все файловые системы, потому что / является корневой папкой.

Для использования домашней папки:

find ~/ -type f -exec grep -H 'text-to-find-here' {} \;

Для текущей папки используйте:

find ./ -type f -exec grep -H 'text-to-find-here' {} \;

Ты можешь использовать:

grep -r "string to be searched"  /path/to/dir

r означает рекурсивный и поэтому будет искать в указанном пути, а также в его подкаталогах. Это скажет вам имя файла, а также распечатает строку в файле, где отображается строка.

Или команда, аналогичная той, которую вы пытаетесь (пример:) для поиска во всех файлах javascript (* .js):

find . -name '*.js' -exec grep -i 'string to search for' {} \; -print

Это напечатает строки в файлах, где отображается текст, но не печатает имя файла.

В дополнение к этой команде мы также можем написать это: grep -rn «String to search» / path / to / directory / or / file -r: рекурсивный поиск n: номер строки будет показан для совпадений


Чтобы искать строку и выводить только эту строку со строкой поиска:

for i in $(find /path/of/target/directory -type f); do grep -i "the string to look for" "$i"; done

например:

for i in $(find /usr/share/applications -type f); \
do grep -i "web browser" "$i"; done

Чтобы отобразить имя файла, содержащее строку поиска:

for i in $(find /path/of/target/directory -type f); do if grep -i "the string to look for" "$i" > /dev/null; then echo "$i"; fi; done;

например:

for i in $(find /usr/share/applications -type f); \
do if grep -i "web browser" "$i" > /dev/null; then echo "$i"; \
fi; done;

grep можно использовать, даже если мы не ищем строку.

Просто бег,

grep -RIl "" .

будет распечатывать путь ко всем текстовым файлам, то есть содержащим только печатные символы.


find /path -type f -exec grep -l "string" {} \;

Объяснение из комментариев

find - это команда, которая позволяет находить файлы и другие объекты, такие как каталоги и ссылки в подкаталогах заданного пути. Если вы не укажете маску, с которой должны встречаться имена файлов, она перечисляет все объекты каталога.

-type f specifies that it should proceed only files, not directories etc.
-exec grep specifies that for every found file, it should run grep command, passing its filename as an argument to it, by replacing {} with the filename




find