Как извлечь текст из изображений с помощью командной строки
Достаточно просто прочитать изображение и вытащить текст самостоятельно. Но динамически вытягивающий текст с фото немного сложнее, и к счастью, imgclip предлагает довольно простое решение.
это инструмент командной строки работает в терминале для Mac, Windows и Linux. Он просто принимает аргумент для файла изображения вместе с языком, затем возвращает текст скопировать в буфер обмена.
Вы можете установить всю библиотеку через npm, и это довольно простая установка. Дело в том всего несколько КБ и он поставляется с файлом JS, который вы можете просматривать на GitHub.
Imgclip использует Tesseract.js библиотека для автоматизации обработки изображений и вытягивания текста через OCR. Это одна из самых мощных библиотек OCR на сегодняшний день, и она полностью с открытым исходным кодом, как и imgclip.
Я думаю, что я больше всего впечатлен качеством и скоростью этого инструмента. Это действительно работает, чтобы вытащить точный текст и это один из самых простых инструментов для использования.
Команда imgclip должна быть запустить прямо в терминале, с последующим относительным путем к изображению. Вы также можете добавить четыре варианта на конец, чтобы настроить вывод.
-час
,--Помогите
: выводит информацию об использовании-В
,--версия
: выводит номер версии-L
,--языки
: выводит язык текста на изображении-п
,--Распечатать
: распечатывает текст на изображении (вместо копирования в буфер обмена)
На момент написания статьи, Тессеракт поддерживает 65 языков с больше на пути. Код, который вы добавляете к --языки
тег должен быть любым кодом, используемым в этих файлах Tesseract.
Например, -я анг
будет искать изображение для Английский текст, в то время как -l jpn
будет искать Японский текст и ты можешь даже бежать -l jpn_vert
искать вертикально ориентированный японский текст.
Поскольку imgclip сильно зависит от Tesseract, вы в основном имеете всю мощь всей этой библиотеки в вашем распоряжении..
к начать, Посетите страницу GitHub и загрузите копию локально или установите ее в определенном каталоге с помощью npm. Затем вы можете запустить инструмент в терминале, как приложение для разобрать любое изображение, которое вы хотите.
Видеть imgclip в действии, посмотрите это короткое видео, созданное в виде демо imgclip.