Искате ли да знаете как можете да заснемете уеб страница и да я запазите като PDF документ или изображение с помощта на терминала? За щастие, Linux разполага с множество помощни програми, които можете да използвате за автоматизиране на задачата за конвертиране на HTML документи в PDF файлове и изображения.

Тази статия ще ви запознае с wkhtmltopdf и wkhtmltoimage, помощни програми, които са ви необходими, за да улеснят работата ви.

Как да конвертирате HTML в PDF

Ако искате да заснемете уеб страници и да ги конвертирате в PDF файл, помощната програма wkhtmltopdf ще ви помогне. Wkhtmltopdf е инструмент с команден ред с отворен код, използван за визуализиране на уеб страници в PDF документи.

Тъй като инструментът работи безгласно в терминала на Linux, няма да имате нужда от уеб драйвер или рамка за автоматизация на браузъра като Selenium.

Инсталирайте wkhtmltopdf на Linux

Wkhtmltopdf не е един от стандартните пакети, които са предварително инсталирани на Linux. Ще трябва да го инсталирате ръчно, като използвате мениджъра на пакети на вашата система.

instagram viewer

За да инсталирате wkhtmltopdf на дистрибуции, базирани на Ubuntu и Debian:

sudo apt install wkhtmltopdf

На базирани на Arch дистрибуции като Manjaro Linux:

sudo pacman -S wkhtmltopdf

Инсталирането на wkhtmltopdf на базирани на RHEL дистрибуции като Fedora и CentOS също е лесно.

sudo dnf инсталирайте wkhtmltopdf

Основен синтаксис

Основният синтаксис на командата е:

wkhtmltopdf име на файл на уеб страница

...където уеб страница е URL адресът на уеб страницата, която искате да конвертирате и име на файл е името на изходния PDF файл.

За да конвертирате началната страница на Google в PDF документ:

wkhtmltopdf https://google.com google.pdf

Изход:

При отваряне на PDF файла, ще забележите, че wkhtmltopdf е направил прецизно уеб страницата в документ.

Отпечатайте няколко копия на уеб страницата

The --копия flag е спасител, ако искате изходният ви файл да има множество копия на уеб страницата. Имайте предвид, че когато отпечатвате множество копия, wkhtmltopdf няма да генерира множество PDF файлове, а вместо това ще добави допълнителни страници към един документ.

За да създадете три копия на началната страница на Google:

wkhtmltopdf --копия 3 https://google.com google.pdf

Изходният PDF файл ще съдържа три страници, както е посочено в гореспоменатата команда.

Добавете филтър в сива скала към изхода

За да добавите филтър за сива скала към PDF файла, използвайте -g или - сива скала флаг с командата:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - скала на сивото https://google.com google.pdf

Изходния файл:

Променете ориентацията на PDF файла

По подразбиране wkhtmltopdf генерира PDF файла във вертикално оформление, т.е.портрет. За да промените това поведение по подразбиране и вместо това да заснемете уеб страници в пейзаж, използвайте --ориентация флаг с командата:

wkhtmltopdf - ориентация пейзаж https://google.com google.pdf

Изход:

Имайте предвид, че хоризонталната версия на документа има по-голяма празна площ в сравнение с портретната.

Не включвайте изображения при конвертиране

Докато генерирате изхода, ако не искате wkhtmltopdf да изобразява изображения, присъстващи в уеб страница, използвайте - няма изображения флаг:

wkhtmltopdf - няма изображения https://google.com google.pdf

Изход:

Свързани: Най-добрите инструменти за редактиране на PDF файл навсякъде

Как да конвертирате уеб страница в изображения

Помощната програма wkhtmltoimage е част от пакета wkhtmltopdf. Ако работите по отчет и искате да включите изображения на уебсайт, този инструмент ще работи във ваша полза. Терминалът на Linux не само ви улеснява да заснемате изображенията, но и ви дава набор от опции, които ви позволяват да персонализирате изхода си.

Основен синтаксис

Wkhtmltoimage има синтаксис, подобен на wkhtmltopdf:

wkhtmltoimage име на файл на уеб страница

...където уеб страница е URL адресът на уебсайт и име на файл е името на изходното изображение.

Преобразуване на уеб страница в изображение

Продължавайки с гореспоменатия пример, нека преобразуваме началната страница на Google в изображения.

wkhtmltoimage https://google.com google.png

Изход:

Можете също така да посочите персонализиран файлов формат, който искате да има изходното изображение. Wkhtmltoimage поддържа следните файлови разширения:

  • JPEG / JPG
  • PNG
  • SVG

Например, ако искате да генерирате JPG изображение, просто заменете разширението на файла с JPG в командата:

wkhtmltoimage https://google.com google.jpg

Свързани: JPG срещу JPEG: Каква е разликата между тези формати на графични файлове?

Заснемане на уеб страници с помощта на терминала Linux

Трябва да имате инсталиран PDF преглед на вашата Linux система, ако искате да видите PDF файловете, генерирани от wkhtmltopdf. Докато повечето дистрибуции на Linux се доставят с предварително инсталиран PDF редактор, можете ръчно да изберете и инсталирате PDF редактор, който отговаря на вашите нужди.

електронна поща
5-те най-добри Linux PDF редактора, които трябва да опитате

Трябва да редактирате PDF файл в Linux? Тези Linux PDF редактори са безплатни за инсталиране и лесни за използване.

Прочетете Напред

Свързани теми
  • Linux
  • PDF
  • Linux
За автора
Дийпеш Шарма (67 публикувани статии)

Deepesh е младши редактор за Linux в MUO. Той пише информационно съдържание в интернет повече от 3 години. В свободното си време той обича да пише, да слуша музика и да свири на китара.

Още от Deepesh Sharma

Абонирайте се за нашия бюлетин

Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и ексклузивни оферти!

Още една стъпка…!

Моля, потвърдете имейл адреса си в имейла, който току-що ви изпратихме.

.