tesseract-ocr

Tesseract é um reconhecimento óptico de caracteres (OCR) de código aberto Motor. Ele pode ser usado diretamente ou (para programadores) usando uma API para extrair texto impresso de imagens. Ele suporta uma ampla variedade de línguas. Este pacote inclui a ferramenta de linha de comando.

Instalação

Na instalação, deve-se instalar o programa e os plugins das linguagens.

apt install tesseract-ocr  tesseract-ocr-por tesseract-ocr-enm

Detectar textos de uma imagem.

tesseract Imagens/Screenshot_20220722_091756.png  saida -l por
#Imagens/Screenshot_20220722_091756.png - O caminho da imagem a ser convertida para ocr.
#saida - arquivo txt da saída do programa.
#-l por - Linguagem portugues selecionada.

Imagem tratada no exemplo acima.

Saída no arquivo txt.

“ send File — Gwenview 4 X

Falha ao carregar a página de configuração para
esta ação:

file:///usr/share/purpose/

nextcloudplugin.config.qml:12 module
"Ubuntu. OnlineAccounts is not installed

O Cancelar