За разлика от текстовия файл, вие не можете да редактирате PDF директно. Има няколко начина за генериране на PDF файлове с помощта на текст. Но какво, ако искате да отидете по друг начин и да конвертирате PDF файлове в текстови файлове?

За щастие, Linux ви позволява лесно да модифицирате тези файлове от терминала. Тази статия ще покаже как да конвертирате PDF файл в текстов документ на Linux.

Конвертиране на PDF в текст от терминала

Poppler е софтуерна библиотека, използвана за изобразяване и модифициране на PDF файлове. Той съдържа помощна програма, известна като pdftotext, което позволява на потребителите да генерират текстови файлове от PDF файлове. От poppler-utils не е част от стандартните Linux пакети, ще трябва да го инсталирате ръчно с помощта на мениджър на пакети.

На Ubuntu и Debian:

sudo apt инсталирайте poppler-utils

За да инсталирате Poppler на Arch Linux:

sudo pacman -S поплер

Инсталиране на poppler-utils пакет на CentOS, Fedora и други базирани на RHEL дистрибуции е лесен.

instagram viewer
sudo dnf инсталирайте poppler-utils
sudo yum инсталирайте poppler-utils

Преобразуване на цял PDF в текст

Основният синтаксис на командата pdftotext е:

pdftotext [опции] pdffile текстов файл

...където pdffile е абсолютният или относителният път към PDF файла и текстов файл е името на изходния файл.

Например да конвертирате lorem-ipsum.pdf към текстов файл:

pdftotext lorem-ipsum.pdf text.txt

Ако файлът, който преобразувате, има водни знаци или текст, който не е подравнен, можете да ги изхвърлите в изхода, като използвате -нодиаг флаг.

pdftotext -nodiag lorem-ipsum.pdf random.text

Обработвайте страници в определен диапазон

Използвай -f и флаг, ако искате да конвертирате страници, които попадат в определен диапазон. Например, за да конвертирате страници от една до пет в lorem-ipsum.pdf към текст:

pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt

За да конвертирате само първата страница на PDF файла:

pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt

Конвертирайте PDF файлове, защитени с парола, в текст

Pdftotext може дори да конвертира PDF файлове, защитени с парола, в текстови файлове. The -upw и -opw знамена, които означават потребителска парола и парола на собственика съответно се погрижете за процеса на удостоверяване, докато конвертирате PDF файловете.

pdftotext -upw парола lorem-ipsum.pdf output.txt
pdftotext -opw парола lorem-ipsum.pdf output.txt

Не забравяйте да замените парола с паролата на PDF файла.

Можете също така да комбинирате множество флагове, за да получите желания изход. Например, за да конвертирате страници от една до три от PDF файл, защитен с парола, в текст:

pdftotext -f 1 -l 3 -upw парола lorem-ipsum.pdf output.txt

Свързани: Как да конвертирате PDF файл в изображения в Linux

Графично конвертиране на PDF в текстов файл

Ако работата с командния ред не е вашата чаша чай, можете да конвертирате PDF файлове в текстови файлове с помощта на графичен софтуер като Calibre. Това е приложение за управление на електронни книги, което можете да използвате, за да преглеждате, организирате и промяна на PDF файлове на вашата система.

Калибърът е достъпен в официалните дистрибутори на Linux и всеки може да го изтегли с помощта на мениджър на пакети.

За да инсталирате Calibre на Ubuntu и Debian:

sudo apt install калибър

На Arch Linux:

sudo pacman -S калибър

На базирани на RHEL дистрибуции като CentOS и Fedora можете да изтеглите Calibre, използвайки DNF или Yum.

sudo dnf инсталиране на калибър
sudo yum инсталиране на калибър

Как да използвам Калибър за конвертиране на PDF файлове

Веднъж инсталиран, стартирайте Calibre на вашата система с помощта на Меню с приложения. Като алтернатива можете да стартирате Calibre от терминала, като напишете:

калибър

За да генерирате текстови файлове с помощта на PDF с Calibre:

  1. Кликнете върху Добавяне на книги опция от менюто.
  2. Намерете и изберете PDF файла, който искате да конвертирате.
  3. Маркирайте PDF файла от централния панел и изберете Конвертиране на книги от менюто.
  4. От Изходен формат падащото меню, изберете текст.
  5. Накрая кликнете върху Добре продължавам.

Calibre сега ще започне да преобразува посочения PDF файл в текстов документ. Можете да проверите състоянието на процеса, като щракнете върху Работни места опция, разположена в долния десен ъгъл на прозореца.

Работа с PDF файлове в Linux

Когато искате да споделите документ с някого, конвертирането му в PDF преди споделяне е най-ефективният начин. Преди потребителите трябваше да инсталират специален PDF преглед в своята система за показване на PDF файлове, но сега почти всеки браузър се предлага с вграден PDF преглед.

Можете да намерите няколко приложения, които позволяват на потребителя лесно да преглежда и редактира PDF файлове. Много инсталации на Linux се доставят с LibreOffice, офис софтуерен пакет, който може да се използва като PDF редактор.

електронна поща
5-те най-добри Linux PDF редактора, които трябва да опитате

Трябва да редактирате PDF файл в Linux? Тези Linux PDF редактори са безплатни за инсталиране и лесни за използване.

Прочетете Напред

Свързани теми
  • Linux
  • PDF
  • PDF редактор
  • Linux
За автора
Дийпеш Шарма (Публикувани 63 статии)

Deepesh е младши редактор за Linux в MUO. Той пише информационно съдържание в интернет повече от 3 години. В свободното си време той обича да пише, да слуша музика и да свири на китара.

Още от Deepesh Sharma

Абонирайте се за нашия бюлетин

Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и ексклузивни оферти!

Още една стъпка…!

Моля, потвърдете имейл адреса си в имейла, който току-що ви изпратихме.

.