Аудиокнигите набират все по-голяма популярност в сравнение с традиционните електронни книги. Те са по-удобни, тъй като можете да ги слушате по всяко време и навсякъде.
Можете да конвертирате PDF електронна книга в аудиокнига с прост скрипт на Python. Използвайки някои прости библиотеки, можете да разработите проект, който ще прочете PDF и ще съхрани аудиокнигата като нов файл.
Инсталиране на необходимите пакети
Трябва да инсталирате PyPDF3, pyttsx3, и pdfводопроводчик пакети, за да започнете. Можете да инсталирате тези пакети с помощта на мениджъра на пакети pip. Уверете се, че вече сте го направили инсталиран pip на вашата система. Изпълнете следната команда в командния ред, за да инсталирате пакетите:
пип Инсталирай PyPDF3 pyttsx3 pdf водопроводчик
- Можете да използвате PyPDF3 библиотека за четене и редактиране на PDF файлове в Python.
- The pyttsx3 библиотеката осигурява преобразуване на текст в реч.
- pdfводопроводчик е библиотека, която ви позволява да извличате текст и таблици от PDF файлове.
Кодът, използван в този проект, е наличен в a GitHub хранилище и е безплатен за използване под лиценза на MIT.
Конвертиране на PDF в аудиокнига с помощта на Python
След като инсталирате горните пакети, вие сте готови да ги импортирате във вашия python файл:
импортиране PyPDF3
импортиране pyttsx3
импортиране pdfводопроводчик
Трябва да предоставите името и местоположението на PDF файла, който искате да конвертирате. За по-голяма простота можете да използвате всеки примерен PDF файл. Копирайте го в същата директория като вашия скрипт и запазете името му в променлива; ако се нарича Lorem.pdf, например:
файл = 'Lorem.pdf'
След това създайте файлов обект за PDF файла и обект за PDF четец:
книга = отворен (файл, 'rb')
pdfReader = PyPDF3.PdfFileReader (книга)
По-късно ще преминете през всички страници на PDF файла. За да намерите общия брой страници, използвайте numPages Имот:
страници = pdfReader.numPages
Сега сте готови да извлечете текста от PDF файла:
окончателен текст = ""
с pdfводопроводчик.отвори(файл) като pdf:
за i в диапазон (0, страници):
страница = pdf.страници[i]
текст = page.extract_text()
finalText += текст
Използвайте for цикъл, за да преминете през всички страници и да извлечете текста от PDF файла. Можете да използвате пакета pdfplumber, за да отворите pdf файла и екстракт_текст метод за извличане на текст от страница.
С пълния текст, съхранен в променлива, можете да го обработвате допълнително, в зависимост от вашите изисквания. Ако искате да конвертирате текста в аудио и да го запишете в нов файл, използвайте следния код:
двигател = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
двигател.runAndWait()
Когато ти стартирайте този код на Python, той ще създаде файл с аудиокнига в своята директория.
Ако не искате да запазите аудиокнигата и например искате да изрецитирате PDF файла, можете вместо това да използвате следния код:
двигател = pyttsx3.init()
двигател.казвам(окончателен текст)
двигател.runAndWait()
Когато стартирате този скрипт, той ще рецитира PDF файла.
Разработвайте проекти с помощта на Python
Python е известен със своята гъвкавост. Можете лесно да създавате проекти с практически приложения с помощта на Python.
Ако искате да си изцапате ръцете с код на Python, можете да започнете с разработването на мини-проекти. Някои добри начални идеи са приложение за тестове, чатбот, игра със змия, програма за съкращаване на URL адреси, уеб скрепер или конвертор на единици.