Cum se extrage text dintr-un PDF în macOS Sierra

Cuprins

Unul dintre cele mai utilizate formate actuale pentru transferul de informații este PDF (Portable Document Format - Portable Document Format) care a fost dezvoltat de Adobe și ne oferă numeroase avantaje precum:

  • Securitate mai mare a documentelor
  • Reducerea dimensiunii originale
  • Compatibilitate cu mai multe dispozitive
  • Păstrează integritatea datelor stocate, printre altele.

Ideea este că, în anumite momente și din mai multe motive, trebuie să extragem exclusiv conținutul textului din fișierul PDF fără a include alte elemente, cum ar fi imagini sau semnături.

Solvetic va analiza cum să efectuați acest proces cu ușurință în macOS Sierra fără a recurge la instrumente suplimentare.

Pasul 1
Deschiderea documentului: primul pas pe care trebuie să îl faceți este să deschideți documentul PDF stocat local în macOS Sierra, care se va face automat cu utilitarul Previzualizare:

Este important să clarificăm că, dacă folosim diferite instrumente, cum ar fi Adobe Reader, fișierul PDF va fi deschis cu acel instrument.

Pasul 2
Selectarea textului: Acum procedăm la copierea informațiilor din fișierul PDF, pe care le facem în mod normal folosind mouse-ul, dar dacă avem mai multe fișiere PDF, aceasta va fi o sarcină care necesită mult timp.

Putem utiliza una dintre următoarele metode pentru a face acest proces mult mai eficient:

  • Mergeți la meniul Editare și selectați opțiunea Selectați tot
  • Utilizați combinația de taste ⌘ + A
.

Odată ce selectăm această opțiune, vom vedea textul selectat:

Pasul 3
Copiați și lipiți conținutul: Odată ce textul din fișierul PDF a fost selectat, continuăm să îl copiați folosind una dintre următoarele opțiuni.

Copiați textul PDF

  • Accesați meniul Editare și selectați Copiere
  • Utilizați combinația de taste ⌘ + C

Odată ce avem aceste informații în clipboard, vom deschide aplicația TextEdit folosind oricare dintre următoarele opțiuni

  • Introduceți textul cuvântului în Spotlight și selectați acolo TextEdit
  • Mergeți la calea merge / Aplicații și selectați acolo TextEdit

Va fi afișată următoarea fereastră. Acolo selectăm butonul Document nou.

Pasul 4
În fereastra nouă mergem la meniul Format și acolo selectăm opțiunea Convertiți în text simplu sau putem folosi combinația de taste ⇧ + ⌘ + T. Rezultatul va fi următorul:

Cu această metodă simplă putem extrage cu ușurință textul din fișierele PDF necesare.

wave wave wave wave wave