Аудиокнигите набират все по-голяма популярност в сравнение с традиционните електронни книги. Те са по-удобни, тъй като можете да ги слушате по всяко време и навсякъде.

Можете да конвертирате PDF електронна книга в аудиокнига с прост скрипт на Python. Използвайки някои прости библиотеки, можете да разработите проект, който ще прочете PDF и ще съхрани аудиокнигата като нов файл.

Инсталиране на необходимите пакети

Трябва да инсталирате PyPDF3, pyttsx3, и pdfводопроводчик пакети, за да започнете. Можете да инсталирате тези пакети с помощта на мениджъра на пакети pip. Уверете се, че вече сте го направили инсталиран pip на вашата система. Изпълнете следната команда в командния ред, за да инсталирате пакетите:

пип Инсталирай PyPDF3 pyttsx3 pdf водопроводчик
  • Можете да използвате PyPDF3 библиотека за четене и редактиране на PDF файлове в Python.
  • The pyttsx3 библиотеката осигурява преобразуване на текст в реч.
  • pdfводопроводчик е библиотека, която ви позволява да извличате текст и таблици от PDF файлове.
instagram viewer

Кодът, използван в този проект, е наличен в a GitHub хранилище и е безплатен за използване под лиценза на MIT.

Конвертиране на PDF в аудиокнига с помощта на Python

След като инсталирате горните пакети, вие сте готови да ги импортирате във вашия python файл:

импортиране PyPDF3
импортиране pyttsx3
импортиране pdfводопроводчик

Трябва да предоставите името и местоположението на PDF файла, който искате да конвертирате. За по-голяма простота можете да използвате всеки примерен PDF файл. Копирайте го в същата директория като вашия скрипт и запазете името му в променлива; ако се нарича Lorem.pdf, например:

файл = 'Lorem.pdf'

След това създайте файлов обект за PDF файла и обект за PDF четец:

книга = отворен (файл, 'rb')
pdfReader = PyPDF3.PdfFileReader (книга)

По-късно ще преминете през всички страници на PDF файла. За да намерите общия брой страници, използвайте numPages Имот:

страници = pdfReader.numPages

Сега сте готови да извлечете текста от PDF файла:

окончателен текст = ""

с pdfводопроводчик.отвори(файл) като pdf:
за i в диапазон (0, страници):
страница = pdf.страници[i]
текст = page.extract_text()
finalText += текст

Използвайте for цикъл, за да преминете през всички страници и да извлечете текста от PDF файла. Можете да използвате пакета pdfplumber, за да отворите pdf файла и екстракт_текст метод за извличане на текст от страница.

С пълния текст, съхранен в променлива, можете да го обработвате допълнително, в зависимост от вашите изисквания. Ако искате да конвертирате текста в аудио и да го запишете в нов файл, използвайте следния код:

двигател = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
двигател.runAndWait()

Когато ти стартирайте този код на Python, той ще създаде файл с аудиокнига в своята директория.

Ако не искате да запазите аудиокнигата и например искате да изрецитирате PDF файла, можете вместо това да използвате следния код:

двигател = pyttsx3.init()
двигател.казвам(окончателен текст)
двигател.runAndWait()

Когато стартирате този скрипт, той ще рецитира PDF файла.

Разработвайте проекти с помощта на Python

Python е известен със своята гъвкавост. Можете лесно да създавате проекти с практически приложения с помощта на Python.

Ако искате да си изцапате ръцете с код на Python, можете да започнете с разработването на мини-проекти. Някои добри начални идеи са приложение за тестове, чатбот, игра със змия, програма за съкращаване на URL адреси, уеб скрепер или конвертор на единици.