реклама

Ако искате да конвертирате всеки отпечатан текст в цифров текст, който можете да копирате, поставите, редактирате и търсите, ще трябва да използвате скенери за оптично разпознаване на символи (OCR).

Когато решите да сканирате или да направите снимка на документ, това ще бъде записано във формат като JPEG или PDF. OCR софтуер след това може да разпознае буквите и цифрите в тези документи и да ги преобразува в търсене в PDF 4 метода за създаване и редактиране на PDF файлове безплатноОт всички често срещани типове файлове, намиращи се в нашия компютърни среди, PDF вероятно е един от най-рестриктивните, като в същото време е достъпен за всички, които могат да го използват (главно за четене) ... Прочетете още или във файл, който можете да редактирате в програми като Microsoft Word.

Проблемът е, че някои OCR скенери работят много по-добре от други, като най-добрият е доста тежък на портфейла.

Omnipage18 например струва $ 150, но е особено добър в разпознаването на различни езици. Adobe Acrobat Pro DC

instagram viewer
струва окото $ 400, но има невероятна точност. ABBYY FineReader струва 150 долара, но е фантастичен при преобразуването на документи като списания и брошури в текст, който може да се търси. По-късно в тази статия ще тестваме онлайн офертата на ABBYY.

Ако обаче търсите безплатни алтернативи, които можете Изтегли и да използвате в Windows или OS X, трябва изпробвайте тези OCR инструменти 5-те най-добри OCR инструменти за извличане на текст от изображенияКогато имате типове хартия, как да получите целия този печатен текст, преобразуван в нещо, което цифровата програма ще може да разпознае и индексира? Дръжте един добър OCR софтуер наблизо. Прочетете още . Но ако предпочитате да използвате безплатен, онлайн OCR инструмент, продължете да четете, както изпробвахме първите няколко, с резултатите по-долу.

Тестът

Изглежда повечето хора използват своите смартфони, за да направят своето сканиране за тях Сканирайте и управлявайте вашите разписки, пестете място, хартия и времеРазписките на хартия лесно се губят и трудно се намират, когато са ви най-необходими. За щастие, преминаването в цифров решава и двата проблема. Прочетете още , Реших да използвам Приложението за сканиране на Evernote (Безплатни за iOS и Android). Сканирах първата страница на Ричард Доукин Изкачване на планина невъзможно, за да видим какви резултати бихме могли да постигнем с много основно форматиране. Сканирах и страница на Тим Ферис Четиричасовият готвач да изпробвате скенерите с малко по-сложно форматиране. Записах всеки от тези файлове като PDF.

Тестване на онлайн OCR

След това тези документи бяха пуснати чрез някои от уж най-добрите онлайн OCR инструменти, за да се види колко добре се справят.

Безплатен онлайн OCR [няма по-дълги налични]

За щастие не е необходима регистрация за използване на безплатен онлайн OCR. И бях двойно впечатлен, когато видях претенцията им да запазят форматирането и оформлението на моя документ.

Безплатно онлайн OCR

Сайтът твърди, че може да поддържа PDF, GIF, BMP, JPEG, TIFF и PNG като вход. Изходите могат да бъдат или DOC, PDF текстов документ, RTF и TXT. За съжаление не можах да разбера дали имат ограничение за размер на файла.

Основен документ към PDF
Преобразува се абсолютно перфектно. Няма много повече за казване! Ние сме на a много добро начало.

Основен документ към DOC
Действителните думи изглежда са се превърнали безотказно, с изключение на „тройката“ от „Маунт Ръшмор“ по някакъв начин AWOL. Форматирането обаче е друга история. Много запетаи бяха заменени с подчертани черти и в точките в целия документ бяха поставени произволни интервали. Когато по-късно видите как премия софтуер се справя в този тест, това не е лошо усилие изобщо.

Сложен документ в PDF
Конвертирането на документа отне огромни 120 секунди! След като бъде завършен, целият текст беше преобразуван с около 95% точност, въпреки че текстът в отделното поле в горния десен ъгъл на страницата беше неразбираем. Няколко други знака в PDF също бяха неправилни.

Сложен документ към DOC
Този път преобразуването отне само 10 секунди, като текстът отново се преобразува с около 95% точност. Имаше някои странни проблеми с разстоянието и софтуерът имаше проблеми с конвертирането на шрифта в горния десен ъгъл на документа и пропусна няколко знака тук-там.

присъда
Ако искате да конвертирате просто форматирани документи в PDF, това е фантастичен инструмент. По отношение на конвертирането в DOC резултатите не бяха нищо за писане у дома.

i2OCR прави някои впечатляващи твърдения. Инструментът разпознава над 60 езика, може да се справи с оформление на много колони (чрез премахване на форматирането), няма ограничения за размер на файла, може да конвертира качени файлове и от URL адреси. И не е необходимо да се регистрирате, за да използвате и този инструмент.

Услугата работи, като просто извлече текста от вашето изображение, след което изведе неформатиран текст. Можете бързо да коригирате всички грешки в страничния изглед, преди да копирате текста в други програми или да изтеглите като DOC, PDF или HTML.

Забележка: когато се опитах да кача своите PDF документи, те бяха отхвърлени от i2OCR, така че трябваше да ги конвертирам в JPEG (като направих екранна снимка на тях, след което качих файловете).

Основен документ за обикновен текстЕкранна снимка 2016-02-11 в 12.30.28
Поради начина, по който работи този инструмент, се формира цялото форматиране, въпреки че преобразуването от изображение в текст беше почти перфектно. Имаше някои малки грешки като разстояние между абзаците и някои запетаи бяха заменени с периоди, но това са малки негри.

Сложен документ за обикновен текстЕкранна снимка 2016-02-11 в 12.39.48
По-голямата част от текста беше преобразувана без много грешки, освен заглавието и рецептата горе вдясно, което беше нечетливо за този инструмент. Начинът, по който колоните са преобразувани в обикновен текст, далеч не е идеален. Ако искате да направите това преобразуване работещо, ще е необходимо много време, за да пренаредите линиите в съгласувани изречения.

присъда
За основните документи i2OCR работи чудесно. Възможността за редактиране на текста преди изтегляне също е много приятно докосване. За по-сложни документи обаче преобразуването все още е доста точно, но начинът, по който се извежда текстът, няма да направи живота ви много по-лесен.

Онлайн OCR в момента поддържа 46 различни езика и може да конвертира PDF, JPG, BMP, TIFF и GIF във формат Word, Excel или Plain Text. Сайтът твърди, че „преобразуваните документи изглеждат точно като оригинала - таблици, колони и графики“.

Версията, която можете да използвате без регистрация, ви позволява да конвертирате до 15 изображения на час (ограничение от 5 МБ). Ако се регистрирате за акаунт, можете да закупите още страници над този лимит, като същевременно можете да конвертирате многостранични документи и ZIP архиви също.

Онлайн резултати от OCR

Основен документ към DOC
Основният документ преобразува безотказно освен римската цифра аз да не бъдат вдигнати. Както обеща сайтът, форматирането беше точно такова, каквото беше в книгата. Кудо към този инструмент.

Сложен документ към DOC
След като се разочаровах от предишните инструменти на OCR при конвертирането на сложния документ, бях силно впечатлен от Онлайн OCR. Оформлението беше почти перфектно, както можете да видите по-горе. За пореден път обаче рецептата не беше подбрана прекалено добре, но всички други малки грешки бяха незначителни.

присъда

Абсолютно фантастични резултати от онлайн OCR. Единственият недостатък, който виждам, е, че няма начин да изтегляте преобразуваните документи като PDF файлове, като споменатите изходни формати включват само DOCX, XLSX и TXT.

Както споменахме по-рано, ABBYY е един от лидерите на пазара на софтуер за OCR, струващ около $ 150 за тяхната пълна програма за изтегляне. Те предлагат a Безплатна пробна версия с 10 страници за техния онлайн инструмент (задължителна регистрация). За абонамент за 5 долара техният онлайн инструмент ще ви позволи да конвертирате 200 страници всеки месец.

ABBYY FineReader Online

Приетите файлове могат да бъдат до 100mb във всеки от тези формати: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP и PNG. ABBYY също признава почти 200 езика. Резултатите са особено впечатляващи с избор между DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 и EPUB.

Можете дори да изпробвате няколко функции на BETA по време на изпитанието си. Първата е възможността да преведете документа си на друг език. Другото е да експортирате преобразувания си документ в своя облачен акаунт за съхранение, независимо дали това е Dropbox, Google Drive, Evernote, Microsoft OneDrive или Box.

Основен документ към DOCX
Общите резултати бяха добри, но не са удивителни, като се има предвид, че това е премиум продукт. Множество запетайки и периоди се разменяха наоколо, няколко обърнати запетаи бяха заменени с звездичка, липсват няколко главни букви и една дума (буквална) е написана неправилно.

Сложен документ към DOCX
След конвертирането в текста в документа има много малко грешки (освен OCR, който се бори отново с шрифта на тази рецепта!), Но форматирането остави много да се желае.

ABBYY Резултат

Трите колони по някакъв начин заеха две страници, с централната колона само появява се на втората страница. Ако всъщност сте искали правя нищо с този преобразуван документ, в крайна сметка ще издърпате косата си.

Основен документ към PDF
Докато преглеждах преобразувания PDF файл, изобщо не можах да намеря грешка. Може би сме намерили къде ABBYY се отличава. Фантастични резултати.

Сложен документ в PDF
Отново не можах да намеря грешки в този преобразуван файл. ABBYY очевидно знае как да преобразува в PDF изключително добре.

присъда
Ако сте щастливи да платите няколко долара, превръщането в PDF изглежда работи изключително добре с тази услуга и е възможност за синхронизиране на преобразувани файлове в облачното ви хранилище е особено полезно, ако сканирате голям обем от документи. Както и при другите опции, ABBYY все още не е измислил как безупречно да преобразува документи в DOC за лесно редактиране.

Крайният резултат

Ако, като повечето хора, просто искате да сканирате няколко статии от списания и някои сметки за домакинства, няма да е необходимо да редактирате тези документи. Следователно преобразуването директно в PDF ще бъде подходящо за вас, тъй като все още ще можете да търсите в тези документи. За това Free Online OCR определено беше най-добрият безплатен инструмент, който тествахме. Това се казва, ако сте готови да плащате по 5 долара на месец за почти съвършенство, ABBYY е FineReader Online беше малко по-точна.

Що се отнася до конвертирането на документи в DOC, не успяхме да намерим идеално решение, но далеч най-добрите резултати бяха от Онлайн OCR. Преобразуването не беше перфектно, но целостта на форматирането до голяма степен се запази непокътната и грешките бяха незначителни. Когато сравняваме тези резултати с „първокласната“ оферта от ABBYY, няма как да не сте впечатлени.

Не включихме Възможностите на Google Drive за OCR в този пост; малко за навсякъде в Google, но повече за факта, че искахме да тестваме няколко други безплатни онлайн OCR услуги там.

За вас: Кои други онлайн OCR инструменти бихте препоръчали на нашите читатели? И кои сте опитвали, че никога повече няма да използвате?

Роб Найтингейл има специалност философия в Университета на Йорк, Великобритания. Работи като мениджър и консултант по социални медии в продължение на повече от пет години, като същевременно изнася работилници в няколко държави. През последните две години Роб също е писател на технологиите и е мениджър на социалните медии на MakeUseOf и редактор на бюлетини. Обикновено ще го намерите да пътува...