windows - чем - чтение больших текстовых файлов




Текстовый редактор для открытия больших(гигантских, больших, больших) текстовых файлов (2)

Я имею в виду 100 + МБ большой; такие текстовые файлы могут вызывать конверт редакторов.

Мне нужно просмотреть большой XML-файл, но не могу, если редактор неисправен.

Какие-либо предложения?


Секреты и уловки

Меньше

Почему вы используете редакторы только для просмотра (большого) файла?

Под * nix или Cygwin просто используйте less . (Существует более известная поговорка - «меньше - больше, более или менее» - потому что «меньше» заменило более раннюю команду Unix «больше», добавив, что вы могли бы прокручивать резервную копию.) Поиск и перемещение под меньшим количеством очень похоже на Vim, но нет файла подкачки и небольшого количества оперативной памяти.

Есть порт Win32 для GNU меньше. См. Раздел «меньше» ответа выше.

Perl

Perl хорош для быстрых скриптов, а его оператор .. (диапазон триггера) делает хороший механизм выбора, чтобы ограничить потерю, которую вы должны пропустить.

Например:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Это будет извлекать все: от линии 1 миллион до 2 миллионов строк, и позволяет вам просеивать вывод вручную меньше.

Другой пример:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

Это начинает печатать, когда «регулярное выражение один» что-то находит и останавливается, когда «регулярное выражение два» находит конец интересного блока. Он может найти несколько блоков. Просеять выход ...

LogParser

Это еще один полезный инструмент, который вы можете использовать. Чтобы процитировать статью в Википедии :

logparser - это гибкая утилита командной строки, которая была первоначально написана сотрудником Microsoft Габриеле Джузепипи, чтобы автоматизировать тесты для регистрации IIS. Он предназначался для использования с операционной системой Windows и был включен в IIS 6.0 Resource Kit Tools. Поведение logparser по умолчанию работает как «конвейер обработки данных», используя выражение SQL в командной строке и выводя строки, содержащие совпадения для выражения SQL.

Microsoft описывает Logparser как мощный универсальный инструмент, обеспечивающий универсальный доступ к текстовым данным, таким как файлы журналов, файлы XML и CSV-файлы, а также ключевые источники данных в операционной системе Windows, такие как журнал событий, реестр, файловой системы и Active Directory. Результаты входного запроса могут быть отформатированы в текстовом виде, или они могут быть сохранены для более специализированных целей, таких как SQL, SYSLOG или диаграмма.

Пример использования:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

Относительность размеров

100 МБ не слишком большой. 3 ГБ становится чем-то большим. Я работал на сервере печати и почты, который создал около 2% почты первого класса в США. Одна из систем, для которых я был техническим лидером, составляла около 15% от количества писем. У нас были некоторые большие файлы для отладки здесь и там.

И больше...

Не стесняйтесь добавлять дополнительные инструменты и информацию здесь. Этот ответ является вики-сообществом по какой-то причине! Нам всем нужно больше советов по работе с большими объемами данных ...


Бесплатные читающие только для чтения зрители:

  • glogg (Windows, macOS, Linux) - Подтверждено для обработки файлов с несколькими ГБ. Его основная функция - поиск регулярных выражений. Имеет вкладки, считывает файлы непосредственно с диска, может просматривать / отслеживать файлы и позволяет пользователю отмечать строки.
  • LogExpert (Windows) - замена графического интерфейса для tail и большой просмотрщик файлов. Поддерживает следующие, поиск, фильтрацию, настраиваемую подсветку, плагины и внешние инструменты. Была ли задатка набухания с файлами журнала> 6 ГБ.
  • Средство просмотра больших текстовых файлов (Windows) - минималистическое и имеет очень маленький размер исполняемого файла. Поддерживает разделенное представление, настройку текстовой темы, поиск в регулярном выражении и последующие.

Бесплатные редакторы:

  • Большой редактор файлов (Windows) - открывает и редактирует файлы TB +, поддерживает Unicode, использует небольшую память, имеет специфичные для XML функции и включает двоичный режим.

Веб-зрители:

  • htmlpen.com - Может открывать и синтаксически выделять файлы TB +. Позволяет редактировать, кроме очень больших файлов. Поддержка поиска, захвата регулярных выражений, экспорта.
  • readfileonline.com - Еще один большой просмотрщик файлов HTML5. Поддерживает поиск.

Платные редакторы:

  • 010 Editor (Windows, macOS, Linux) - Открывает гигантские (до 50 ГБ) файлы.
  • SlickEdit (Windows, macOS, Linux) - Может открывать большие файлы.
  • UltraEdit (Windows, macOS, Linux) - Может открывать файлы объемом более 6 ГБ, но для этого необходимо изменить конфигурацию: Меню »Дополнительно» Конфигурация »Обработка файлов» Временные файлы »Открыть файл без временного файла ...
  • EmEditor (Windows) - отлично обрабатывает очень большие текстовые файлы (официально до 248 ГБ, но до 900 ГБ согласно одному отчету).

И, конечно же,

  • Редакторы традиционных программистов. Пробовали ли вы открыть большой файл с помощью обычного редактора? Некоторые редакторы могут обрабатывать достаточно большие файлы. В частности, Notepad++ (Windows) поддерживает файлы объемом до 2 ГБ.
  • Vim и Emacs (Windows, macOS, Linux) - Все знают, что это за программы. Их трудно изучить, но они чрезвычайно эффективны и хороши с большими файлами.
  • less (Windows, macOS, Linux) - Пейджер из командной строки и традиционный инструмент Unix. Эта программа поставляется с MacOS и Linux. В Windows он может быть установлен с MSYS2, Chocolatey, Cygwin, MinGW или WSL; или вручную, загрузив двоичные файлы GnuWin32 , извлекая less.exe и добавив его в PATH .
  • MORE (Windows). Это относится к Windows MORE , а не к Unix more . Эта встроенная программа доступна во всех версиях Windows и позволяет вам читать по одному экрану за раз. Это хорошо, если вы работаете в Windows и не хотите ничего устанавливать.






large-files