Домашняя » Инструментарий » Как извлечь текст из изображений с помощью командной строки

    Как извлечь текст из изображений с помощью командной строки

    Достаточно просто прочитать изображение и вытащить текст самостоятельно. Но динамически вытягивающий текст с фото немного сложнее, и к счастью, imgclip предлагает довольно простое решение.

    это инструмент командной строки работает в терминале для Mac, Windows и Linux. Он просто принимает аргумент для файла изображения вместе с языком, затем возвращает текст скопировать в буфер обмена.

    Вы можете установить всю библиотеку через npm, и это довольно простая установка. Дело в том всего несколько КБ и он поставляется с файлом JS, который вы можете просматривать на GitHub.

    Imgclip использует Tesseract.js библиотека для автоматизации обработки изображений и вытягивания текста через OCR. Это одна из самых мощных библиотек OCR на сегодняшний день, и она полностью с открытым исходным кодом, как и imgclip.

    Я думаю, что я больше всего впечатлен качеством и скоростью этого инструмента. Это действительно работает, чтобы вытащить точный текст и это один из самых простых инструментов для использования.

    Команда imgclip должна быть запустить прямо в терминале, с последующим относительным путем к изображению. Вы также можете добавить четыре варианта на конец, чтобы настроить вывод.

    1. -час, --Помогите: выводит информацию об использовании
    2. , --версия: выводит номер версии
    3. -L, --языки: выводит язык текста на изображении
    4. -п, --Распечатать: распечатывает текст на изображении (вместо копирования в буфер обмена)

    На момент написания статьи, Тессеракт поддерживает 65 языков с больше на пути. Код, который вы добавляете к --языки тег должен быть любым кодом, используемым в этих файлах Tesseract.

    Например, -я анг будет искать изображение для Английский текст, в то время как -l jpn будет искать Японский текст и ты можешь даже бежать -l jpn_vert искать вертикально ориентированный японский текст.

    Поскольку imgclip сильно зависит от Tesseract, вы в основном имеете всю мощь всей этой библиотеки в вашем распоряжении..

    к начать, Посетите страницу GitHub и загрузите копию локально или установите ее в определенном каталоге с помощью npm. Затем вы можете запустить инструмент в терминале, как приложение для разобрать любое изображение, которое вы хотите.

    Видеть imgclip в действии, посмотрите это короткое видео, созданное в виде демо imgclip.