Домашняя » Крутые сайты » 5 бесплатных онлайн-услуг распознавания текста протестированы и проверены

    5 бесплатных онлайн-услуг распознавания текста протестированы и проверены

    У вас есть документ PDF или изображение, которое вы хотите преобразовать в текст? Недавно кто-то прислал мне по почте документ, который мне нужно было отредактировать и отправить обратно с исправлениями. Человек не смог найти цифровую копию, поэтому мне было поручено перевести весь этот текст в цифровой формат..

    Я никак не мог потратить часы на то, чтобы набрать все обратно, поэтому я в итоге получил красивую качественную фотографию документа, а затем прожег кучу онлайн-услуг OCR, чтобы посмотреть, какой из них даст мне лучшее Результаты.

    В этой статье я рассмотрю несколько моих любимых сайтов для OCR, которые бесплатны. Стоит отметить, что большинство этих сайтов предоставляют базовую бесплатную услугу, а затем имеют платные опции, если вам нужны дополнительные функции, такие как большие изображения, многостраничные документы PDF, разные языки ввода и т. Д..

    Также полезно знать заранее, что большинство этих служб не смогут соответствовать форматированию вашего исходного документа. Это в основном для извлечения текста и все. Если вам нужно, чтобы все было в определенном макете или формате, вам придется сделать это вручную, как только вы получите весь текст из OCR.

    Кроме того, наилучшие результаты для получения текста будут получены из документов с разрешением от 200 до 400 точек на дюйм. Если у вас изображение с низким DPI, результаты будут не такими хорошими.

    Наконец, я протестировал множество сайтов, которые просто не работали. Если вы воспользуетесь бесплатным онлайн-распознаванием Google, вы увидите несколько сайтов, но некоторые из сайтов в топ-10 результатов даже не завершили конверсию. Некоторые из них будут время ожидания, другие будут давать ошибки, а некоторые просто застряли на странице «конвертации», поэтому я даже не удосужился упомянуть эти сайты.

    Для каждого сайта я проверил два документа, чтобы увидеть, насколько хорошими будут результаты. Для своих тестов я просто использовал свой iPhone 5S, чтобы сфотографировать оба документа, а затем загрузил их непосредственно на веб-сайты для конвертации..

    Если вы хотите посмотреть, как выглядели изображения, которые я использовал для своего теста, я прикрепил их здесь: Test1 и Test2. Обратите внимание, что это не полные версии изображений, снятых с телефона. Я использовал изображение с полным разрешением при загрузке на сайты.

    OnlineOCR

    OnlineOCR.net - чистый и простой сайт, который показал очень хорошие результаты в моем тесте. Главное, что мне нравится в этом, - это то, что у него нет тонны рекламы повсюду, что обычно имеет место с этими типами нишевых сервисных сайтов.

    Для начала выберите файл и дождитесь окончания загрузки. Максимальный размер загрузки для этого сайта составляет 100 МБ. Если вы зарегистрируете бесплатную учетную запись, вы получите несколько дополнительных функций, таких как больший размер загрузки, многостраничные PDF-файлы, разные языки ввода, больше конверсий в час и т. Д..

    Далее выберите язык ввода, а затем выберите формат вывода. Вы можете выбрать из Word, Excel или обычный текст. Нажмите на Перерабатывать кнопку, и вы увидите текст, отображаемый внизу в окне вместе со ссылкой на скачивание.

    Если вам нужен только текст, просто скопируйте и вставьте его из коробки. Тем не менее, я предлагаю вам загрузить документ Word, потому что он делает удивительно большую работу по сохранению макета исходного документа.

    Например, когда я открыл документ Word для второго теста, я с удивлением обнаружил, что документ содержит таблицу с тремя столбцами, как на изображении.

    Из всех сайтов этот был лучшим на сегодняшний день. Стоит зарегистрироваться, если вам нужно сделать много конверсий..

    Для полноты я также собираюсь дать ссылку на выходные файлы, созданные каждым сервисом, чтобы вы могли увидеть результаты самостоятельно. Вот результаты OnlineOCR: Test1 Doc и Test2 Doc.

    Обратите внимание, что при открытии этих документов Word на вашем компьютере в Word вы получите сообщение о том, что он из Интернета, и редактирование было отключено. Это нормально, потому что Word не доверяет документам из Интернета, и вам действительно не нужно включать редактирование, если вы просто хотите просмотреть документ.

    i2OCR

    Еще один сайт, который дал довольно хорошие результаты, был i2OCR. Процесс очень похож: выберите свой язык, файл, а затем нажмите Извлечь текст.

    Вам придется подождать минуту или две здесь, потому что этот сайт занимает немного больше времени. Кроме того, на шаге 2 убедитесь, что ваше изображение отображается в окне предварительного просмотра правой стороной вверх, в противном случае вы получите кучу абсурда в качестве вывода. По какой-то причине изображения с моего iPhone показывались в портретном режиме на моем компьютере, но в альбомной ориентации при загрузке на этот сайт.

    Мне пришлось вручную открыть изображение в приложении для редактирования фотографий, повернуть его на 90 градусов, затем повернуть его обратно в портрет и затем снова сохранить. После завершения прокрутите вниз, и он покажет вам предварительный просмотр текста вместе с кнопкой загрузки.

    Этот сайт довольно хорошо справился с результатами первого теста, но не так хорошо со вторым тестом, в котором была размещена колонка. Вот результаты i2OCR: Тест1 Док и Тест2 Док.

    FreeOCR

    Free-OCR.com возьмет ваши изображения и преобразует их в обычный текст. У него нет возможности экспортировать в формат Word. Выберите файл, выберите язык и затем нажмите Начните.

    Сайт работает быстро, и вы получите результат довольно быстро. Просто нажмите на ссылку, чтобы загрузить текстовый файл на свой компьютер.

    Как и в случае с NewOCR, упомянутым ниже, этот сайт использует все T в документе. Я понятия не имею, почему он это сделал, но по какой-то странной причине этот сайт и NewOCR сделали это. Это не имеет большого значения, чтобы изменить его, но это утомительный процесс, который вы действительно не должны делать.

    Вот результаты из FreeOCR: Test1 Doc и Test2 Doc.

    ABBYY FineReader Online

    Чтобы использовать FineReader Online, вы должны зарегистрировать учетную запись, которая дает вам 15-дневную бесплатную пробную версию для OCR до 10 страниц бесплатно. Если вам нужно сделать однократное распознавание текста для нескольких страниц, вы можете воспользоваться этой услугой. Убедитесь, что вы нажали ссылку для подтверждения в электронном письме с подтверждением после регистрации.

    Нажмите на признать вверху и затем нажмите Загрузить выбрать свой файл. Выберите ваш язык, формат вывода и затем нажмите признать внизу. Этот сайт имеет чистый интерфейс и без рекламы тоже.

    В моих тестах этот сайт мог получать текст из первого тестового документа, но он был абсолютно огромен, когда я открыл документ Word, поэтому я снова сделал это и выбрал Plain Text в качестве выходного формата.

    Для второго теста со столбцами документ Word был пуст, и я даже не мог найти текст. Не уверен, что там произошло, но, похоже, он не в состоянии обработать что-либо, кроме простых абзацев. Вот результаты FineReader: Test1 Doc и Test2 Doc.

    NewOCR

    Следующий сайт, NewOCR.com, был в порядке, но далеко не так хорош, как первый. Во-первых, у него есть реклама, но, к счастью, не тонна. Сначала выберите свой файл, а затем нажмите предварительный просмотр кнопка.

    Затем вы можете повернуть изображение и настроить область, в которой вы хотите сканировать текст. Это похоже на процесс сканирования на компьютере с подключенным сканером..

    Если документ имеет несколько столбцов, вы можете проверить Анализ макета страницы Кнопка, и он будет пытаться разбить текст на столбцы. Нажмите кнопку OCR, подождите несколько секунд до его завершения, а затем прокрутите страницу вниз, когда страница обновится..

    В первом тесте он получил весь текст правильно, но по какой-то причине каждый T в документе стал заглавным! Не знаю, почему это так, но это так. Во втором тесте с включенным анализом страницы он получил большую часть текста, но макет был полностью отключен.

    Вот результаты из NewOCR: Test1 Doc и Test2 Doc.

    Заключение

    Как вы можете видеть, к сожалению, в большинстве случаев бесплатность не дает хороших результатов. Первый упомянутый сайт является лучшим на сегодняшний день, поскольку он не только отлично справился с распознаванием всего текста, но и сохранил формат исходного документа..

    Если вам нужен только текст, большинство сайтов, перечисленных выше, смогут сделать это для вас. Если у вас есть какие-либо вопросы, не стесняйтесь комментировать. наслаждаться!