Как считать слова в текстовом файле Linux

Как считать слова в текстовом файле Linux

Рубрики:

Linux, Терминал Linux

Метки:

, , ,

Поиск шаблонов или слов текста в файлах — одна из самых распространенных задач, которые Вы будете выполнять в своей карьере системного администратора. Графический интерфейс пользователя (GUI) позволяет достаточно быстро и удобно найти определенный шаблон в текстовых файлах. Поиск слов или фраз происходит просто нажатием Ctrl + F и вводом символов, которые Вы хотите найти. Однако, не все дистрибутивы Linux поддерживают такой способ поиска шаблонов. И не всегда ОС вообще имеет графический интерфейс пользователя. Серверы и другое оборудование, как правило, управляются минималистичными сборками, единственным способом взаимодействия с которыми является консоль.

Представим, что Вам нужно посчитать сколько раз слово, фраза или символ встречаются в текстовом файле. В этой статье мы расскажем о том, как узнать точное количество повторений определенного шаблона с помощью терминала Linux.

Содержание:

  1. Используйте команды grep и wc для подсчета слова
  2. Используйте комбинацию команд tr и grep
  3. Выводы

Используйте команды grep и wc для подсчета слова

Для демонстрации создадим файл, в который скопируем текст-«рыбу» — Lorem Ipsum. Чтобы вывести на экран содержимое файла, используйте следующую команду:

 

Содержимое файла

Теперь давайте попробуем выяснить, сколько раз встречается определенное слово. В данном примере мы будем использовать комбинацию команд grep и wc. Слово, количество вложений которого мы будем считать в нашем примере — tortor. Итак, выполните следующую команду:

 

Поиск с помощь grep

Как видно на скриншоте, данное слово встречается 8 раз. Давайте же разберем команду детально. С командой grep мы использовали две опции:

  • -o или --only-matching — ее задача состоит в поиске совпадающих шаблонов строк;
  • -i или --ignore-case — она будет игнорировать различия в регистре в шаблонах и входных данных, чтобы символы, отличающиеся только регистром, совпадали друг с другом.

В правой части мы добавили с помощью конвейера команду wc, которая считает количество строк или слов в тексте. В данном случае использовалась опция -l или --lines, которая указывает количество строк. Таким образом, данная комбинация команд успешно выполнила поставленную задачу. А именно — подсчитала число вложений слова tortor.

Читайте также: 12 практических примеров команды grep в Linux

Используйте комбинацию команд tr и grep

Во втором примере мы рассмотрим одновременное использование команд tr и grep. В качестве шаблона снова попробуем подсчитать количество вложений слова tortor в том же текстовом файле. Выполните следующую команду:

 

Поиск с помощь tr

Теперь рассмотрим компоненты команды. В левой части мы использовали команду tr — с ее текст был преобразован так, чтобы перенести каждое слово с новой строки (в качестве разделителя мы выбрали пробел). Далее мы использовали команду grep с параметром -c или --count. Это позволило подсчитать строки, соответствующие искомому шаблону в выводе команды tr.

Как Вы могли заметить, мы получили аналогичный результат. Следовательно, этот способ тоже работает, его можно использовать для подсчета вложений шаблона в тексте.

Выводы

Выполнять подсчет количества вложений заданных слов, символов или целых предложений в текстовом файле — довольно просто. Кроме того, решить подобную задачу можно разными способами. Советуем Вам освоить несколько из них, чтобы лучше разобраться в возможностях командной строки GNU / Linux.

Спасибо за время, уделенное прочтению статьи!

Если возникли вопросы — задавайте их в комментариях.

Подписывайтесь на обновления нашего блога и оставайтесь в курсе новостей мира инфокоммуникаций!

Чтобы знать больше и выделяться знаниями среди толпы IT-шников, записывайтесь на курсы Ciscoкурсы по кибербезопасностиполный курс по кибербезопасностикурсы DevNet / DevOps (программируемые системы) от Академии Ciscoкурсы Linux от Linux Professional Institute на платформе SEDICOMM University (Университет СЭДИКОММ).

Курсы Cisco, Linux, кибербезопасность, DevOps / DevNet, Python с трудоустройством!

Спешите подать заявку! Группы стартуют 25 января, 26 февраля, 22 марта, 26 апреля, 24 мая, 21 июня, 26 июля, 23 августа, 20 сентября, 25 октября, 22 ноября, 20 декабря.
Что Вы получите?
  • Поможем стать экспертом по сетевой инженерии, кибербезопасности, программируемым сетям и системам и получить международные сертификаты Cisco, Linux LPI, Python Institute.
  • Предлагаем проверенную программу с лучшими учебниками от экспертов из Cisco Networking Academy, Linux Professional Institute и Python Institute, помощь сертифицированных инструкторов и личного куратора.
  • Поможем с трудоустройством и стартом карьеры в сфере IT — 100% наших выпускников трудоустраиваются.
Как проходит обучение?
  • Проведем вечерние онлайн-лекции на нашей платформе.
  • Согласуем с вами удобное время для практик.
  • Если хотите индивидуальный график — обсудим и реализуем.
  • Личный куратор будет на связи, чтобы ответить на вопросы, проконсультировать и мотивировать придерживаться сроков сдачи экзаменов.
  • Всем, кто боится потерять мотивацию и не закончить обучение, предложим общение с профессиональным коучем.
А еще поможем Вам:
  • отредактировать или создать с нуля резюме;
  • подготовиться к техническим интервью;
  • подготовиться к конкурсу на понравившуюся вакансию;
  • устроиться на работу в Cisco по специальной программе. Наши студенты, которые уже работают там: жмите на #НашиВCisco Вконтакте, #НашиВCisco Facebook.
Чтобы учиться на курсах Cisco, Linux LPI, кибербезопасность, DevOps / DevNet, Python, подайте заявку или получите бесплатную консультацию.

Рубрики:

Linux, Терминал Linux

Метки:

, , ,

Больше похожих постов

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Заполните поле
Заполните поле
Пожалуйста, введите корректный адрес email.
Вы должны согласиться с условиями для продолжения


Поиск по сайту
Лучшее
Популярное
Рубрики
Меню