Comenzi Pdfgrep pentru căutarea fișierelor PDF Terminal Linux

Sistemele de operare se bazează pe linii de comandă care ne oferă multiple opțiuni pentru a crește capacitățile de distribuție, putând executa căutări, acțiuni de administrare, suport și multe altele.

Tocmai una dintre aceste opțiuni este legată de posibilitatea de a căuta anumite tipuri de fișiere în Linux și astfel de a accesa cu ușurință conținutul acestora și de aceea astăzi vom vorbi despre pdfgrep care este axat pe căutarea fișierelor PDF.

Ce este pdfgrepPdfgrep este un utilitar de linie de comandă pentru a căuta text în fișiere PDF într-un mod simplu și funcțional, economisindu-ne timp de la accesarea fiecărui fișier și căutarea textului cu instrumente PDF.
Unele dintre caracteristicile sale sunt:

  • Compatibil cu Grep, putem executa mulți parametri grep precum -r, -i, -n sau -c.
  • Posibilitatea de a căuta text în mai multe fișiere PDF
  • Culori recomandate, această opțiune de culoare GNU Grep este acceptată și activată implicit.
  • Sprijină utilizarea expresiilor regulate.
  • Software gratuit

1. Instalați Pdfgrep pe Linux

Pasul 1
În acest caz, vom folosi Ubuntu pentru care este suficient să executăm următoarea linie. Acolo introducem litera S pentru a accepta descărcarea și instalarea pachetelor.

 sudo apt instalează pdfgrep

Pasul 2
Alte opțiuni de instalare sunt:

  • Descărcați fișierul .TAR.GZ la următorul link.

Pasul 3

  • Sau executați următoarea comandă:
 git clone https://gitlab.com/pdfgrep/pdfgrep.git
Pasul 4
Apoi introduceți fiecare dintre următoarele rânduri în ordinea lor:
 ./configure make sudo make install

2. Utilizați Pdfgrep pe Linux

Pasul 1
Odată ce pdfgrep este instalat, aceasta va fi sintaxa de utilizat:

 pdfgrep [OPȚIUNE …] MODEL [FIȘIER]
Pasul 2
Fiecare dintre elemente sunt:
  • Opțiune: indică atributele pe care le putem adăuga în căutare, de exemplu -i sau --ignore-case, care ignoră distincția literelor mari și mici între modelul pe care l-am indicat și cel care trebuie să se potrivească fișierului.
  • Model: indică o expresie regulată extinsă.
  • Fișier: Este fișierul PDF unde trebuie executată căutarea.

Pasul 3
Vom începe cu o căutare simplă, de exemplu, vom căuta cuvântul Solvetic în fișierul Solvetic.pdf, pentru aceasta executăm următoarele:

 pdfgrep Solvetic Solvetic.pdf

MARI

Pasul 4
În acest caz, acest termen există o singură dată în fișierul menționat, dar acum vom căuta termenul Windows într-un fișier oficial Microsoft PDF și acesta va fi rezultatul pe care îl vom vedea:

MARI

Pasul 5
Putem vedea că cuvântul căutat este evidențiat, ceea ce facilitează localizarea acestuia. Acum, dacă adăugăm parametrul -în, Va fi posibil să vedeți rezultatele cu numărul paginii unde a fost detectat acest termen:

MARI

Pasul 6
O altă opțiune pe care o putem folosi cu pdfgrep este listarea fișierelor PDF care conțin un anumit termen, pentru aceasta executăm următoarele:

 pdfgrep Solvetic * pdf
Pasul 7
În acest fel, fișierul PDF care conține termenul Solvetic va fi listat:

MARI

Pasul 8
Dacă dorim să deschidem fișierul PDF putem executa următoarea comandă:

 xdg-open (File.PDF)

MARI

Pasul 9
Opțiunile generale pe care ni le oferă pdfgrep sunt:

-i, --ignore-caseIgnorați distincțiile de majuscule atât în ​​fișierele sursă, cât și în cele de intrare.

-F, --fixed-stringsInterpretează PATTERN ca listă de șiruri fixe separate prin linii noi.

- cacheUtilizați un cache pentru textul redat pentru a accelera funcționarea pe fișiere mari.

-P, --perl-regexpInterpretează PATTERN ca o expresie regulată compatibilă cu Perl (PCRE).

-H, --cu-nume-fișierImprimați numele fișierului pentru fiecare potrivire.

-h, --no-nameSuprimă prefixul numelui de fișier din ieșire.

-n, --page-numberPrefixați fiecare potrivire cu numărul paginii unde a fost găsit termenul de căutare.

-c, --countSuprimă ieșirea normală și imprimă în schimb numărul de potriviri pentru fiecare fișier de intrare.

-p, - număr de paginiImprimați numărul de potriviri pe pagină. Implică -n.

--CuloarePermite evidențierea numelor fișierelor, numerelor de pagină și potrivirea textului cu diferite secvențe pentru a le afișa color în terminal, unele dintre opțiunile sale sunt Întotdeauna, ceafă sau automată.

-o, --onumai potrivireImprimați doar partea potrivită a unei linii fără context înconjurător.

-r, --recursivNe permite să căutăm recursiv toate fișierele (restricționate de --include și --exclude) sub fiecare director, urmând linkurile simbolice numai dacă sunt pe linia de comandă.

-R, - referință-recursivăLa fel ca -r, dar urmează toate legăturile simbolice.

-quiet sau -qNe permite să ieșim din aplicație.

Cu acest pdfgrep devine o soluție ideală atunci când lucrați cu fișiere PDF în medii Linux.

wave wave wave wave wave