tesseract-ocr
Tesseract é um reconhecimento óptico de caracteres (OCR) de código aberto Motor. Ele pode ser usado diretamente ou (para programadores) usando uma API para extrair texto impresso de imagens. Ele suporta uma ampla variedade de línguas. Este pacote inclui a ferramenta de linha de comando.
Instalação
Na instalação, deve-se instalar o programa e os plugins das linguagens.
apt install tesseract-ocr tesseract-ocr-por tesseract-ocr-enm
Detectar textos de uma imagem.
tesseract Imagens/Screenshot_20220722_091756.png saida -l por
#Imagens/Screenshot_20220722_091756.png - O caminho da imagem a ser convertida para ocr.
#saida - arquivo txt da saída do programa.
#-l por - Linguagem portugues selecionada.
Imagem tratada no exemplo acima.
Saída no arquivo txt.
“ send File — Gwenview 4 X
Falha ao carregar a página de configuração para
esta ação:
file:///usr/share/purpose/
nextcloudplugin.config.qml:12 module
"Ubuntu. OnlineAccounts is not installed
O Cancelar