Leitura com a função OCR

Este modo permite executar o OCR (reconhecimento ótico de carateres) para extrair dados que possam ser reconhecidos como texto, a partir da imagem lida, e criar um ficheiro PDF/XPS/OOXML (pptx/docx) pesquisável. Também pode programar <Compacto> se selecionar PDF ou XPS como formato de ficheiro.
Para obter informações sobre os produtos opcionais necessários para utilizar esta função e formatos de ficheiros, consulte Opções do sistema.

Leitura com OCR

1
Coloque o original. Colocar originais
2
Carregue em <Ler e Enviar>. Ecrã <Início>
3
Especifique o destino do ecrã de funções básicas de leitura. Ecrã de funções básicas de leitura
4
Especifique as programações de leitura conforme necessário. Operações básicas para a leitura de originais
5
Selecione um formato de ficheiro.
Se quiser dividir várias imagens e enviá-las como ficheiros separados, cada um com uma só página, carregue em <Dividir em páginas>  introduza o número de páginas para a divisão  carregue em <OK>. Se quiser ler as imagens como um único ficheiro, carregue em <Dividir em páginas>  <Cancelar progr.>.
Para selecionar PDF
Para selecionar XPS
Para selecionar o formato Word para OOXML
Para selecionar o formato PowerPoint para OOXML
6
Carregue em <OK>.
Se selecionar <PDF (OCR)>, <XPS (OCR)> ou <OOXML (OCR)> como formato de ficheiro e se o item <Leitura inteligente> estiver programado para <Ligado> em <OCR (Text Searchable) Settings>/<OCR (Priorid. velocidade)>, a máquina deteta a orientação do original e, se for necessário, roda o documento automaticamente antes de o enviar. <Programações OCR (Texto pesquisável)>
Se selecionar <PDF> ou <XPS> como formato de ficheiro, pode programar <Compacto> e <OCR (Texto pesquisável)> ao mesmo tempo. Nesse caso, <PDF (Compacto)> ou <XPS (Compacto)> aparece como formato de ficheiro no ecrã de funções básicas de Ler e Enviar.
Se selecionar <Word> para <OOXML>, pode programar a eliminação das imagens de fundo lidas. Pode criar ficheiros do Word que são fáceis de editar sem imagens desnecessárias. <Incluir imagens de fundo no ficheiro Word>
Se estiver presentemente a utilizar a função <Ler e Guardar>, só pode selecionar os idiomas a utilizar para OCR quando <Word> estiver selecionado para <OOXML> ou <OCR (Priorid. precisão)> estiver selecionado para <PDF>.

Os resultados de OCR não são satisfatórios

Quando cria ficheiros PDF/XPS/OOXML com texto pesquisável, o OCR (Reconhecimento ótico de carateres) pode não ser corretamente processado. Pode dever-se ao facto de as programações na máquina, ou o idioma, tipo de caráter ou formato do documento original não serem adequados para processamento OCR.

Verificar as programações da máquina e idiomas suportados

É possível melhorar o processamento OCR personalizando as programações da máquina no que diz respeito ao reconhecimento de carateres de acordo com os originais ou utilizando tipos de carateres ou tipos de letra adequados nos originais de modo que a máquina consiga reconhecer os carateres.

Programações e idiomas para processamento OCR

Item
Detalhes
Programações de idioma para reconhecimento de carateres
Quando é especificado um idioma com OCR selecionado em <Formato fich.>:
Os carateres são reconhecidos com base no idioma selecionado para cada formato de ficheiro.
Quando não é especificado um idioma com OCR selecionado em <Formato fich.>:
Os carateres são reconhecidos com base no idioma selecionado em <Comutação idioma/teclado> (<Comutação idioma/teclado>).*1
Idiomas asiáticos reconhecíveis*2
Japonês, Chinês (Simplificado), Chinês (Tradicional), Coreano
Tipos de carateres e tipos de letra reconhecíveis (idiomas asiáticos)
Idiomas e grupos de idiomas europeus reconhecíveis
Idiomas:
Inglês, Francês, Italiano, Alemão, Espanhol, Neerlandês, Português, Albanês, Catalão, Dinamarquês, Finlandês, Islandês, Norueguês, Sueco, Croata, Checo, Húngaro, Polaco, Eslovaco, Estónio, Letão, Lituano, Russo, Grego, Turco, Esloveno*3, Romeno*3, Búlgaro*3, Hebreu*3
Grupos de idiomas:
Europeu Ocidental (ISO)*4, Europeu Central (ISO)*5, Báltico (ISO)*6
Tipos de carateres e tipos de letra reconhecíveis (idiomas europeus)
*1 Os idiomas mostrados na lista podem ser diferentes. Se selecionar Inglês, Francês, Italiano, Alemão, Espanhol, Tailandês ou Vietnamita, o idioma selecionado é reconhecido como Europeu Ocidental (ISO).
*2 Não é possível detetar idiomas asiáticos quando a opção <OCR (Priorid. precisão)> está selecionada.
*3 Isto só pode ser selecionado com <OCR (Priorid. precisão)>.
*4 Incluindo Inglês, Francês, Italiano, Alemão, Espanhol, Neerlandês, Português, Albanês, Catalão, Dinamarquês, Finlandês, Islandês, Norueguês e Sueco.
*5 Incluindo Croata, Checo, Húngaro, Polaco e Eslovaco.
*6 Incluindo Estónio, Letão e Lituano.

Tipos de carateres e tipos de letra reconhecíveis (idiomas asiáticos)

Item
Detalhes
Tipos de carateres reconhecíveis
Japonês:
carateres alfanuméricos, carateres Kana, carateres Kanji (JIS primeiro nível e alguns JIS segundo nível), símbolos
Chinês (Simplificado):
carateres alfanuméricos, carateres chineses, símbolos (GB2312-80)
Chinês (Tradicional):
carateres alfanuméricos, carateres chineses, símbolos (Big5)
Coreano:
carateres alfanuméricos, carateres chineses, carateres Hangul, símbolos (KSC5601)
Tipos de letra reconhecíveis
São suportados vários tipos de letra. (recomendado o tipo Ming-cho.)
Os carateres em itálico podem não ser reconhecidos.
Tipos de letra utilizados para carateres convertidos (apenas quando o Word está selecionado como formato de ficheiro)
Japonês:
carateres asiáticos: MS Mincho
Carateres europeus: Century
Chinês (Simplificado):
Carateres asiáticos: SimSun
Carateres europeus: Calibri
Chinês (Tradicional):
Carateres asiáticos: PMingLiU
Carateres europeus: Calibri

Tipos de carateres e tipos de letra reconhecíveis (idiomas europeus)

Item
Detalhes
Tipos de carateres reconhecíveis
Carateres alfanuméricos, carateres especiais do idioma reconhecido*1, símbolos
Tipos de letra reconhecíveis
São suportados vários tipos de letra. (São recomendados os tipos de letra Times, Century e Arial.)*2
Os carateres em itálico podem ser reconhecidos.
Tipos de letra utilizados para carateres convertidos (apenas quando o Word está selecionado como formato de ficheiro)
Calibri
O estilo itálico não é reproduzido.
*1 Os carateres gregos especiais seguintes podem ser reconhecidos. Os carateres especiais de cada idioma também podem ser reconhecidos. Alguns carateres especiais podem não ser reconhecidos, consoante os idiomas.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω
*2 Quando a opção <OCR (Priorid. precisão)> está selecionada, os tipos de letra Arial, Times New Roman e Courier New são reconhecidos.

Verificar o formato dos documentos originais

Utilize originais adequados para processamento OCR para melhorar a precisão de processamento ao criar ficheiros PDF/XPS/OOXML pesquisáveis.
Item
Detalhes
Formato do original
Documentos impressos, documentos de processador Word (documentos compostos por texto, gráficos, fotografias ou tabelas e sem inclinação dos carateres)
Formato de texto
Escrita horizontal e vertical (documentos que contêm escrita horizontal e vertical também podem ser reconhecidos)
Para o texto europeu e coreano apenas pode ser reconhecida escrita horizontal.
Documentos com uma a três colunas sem programações de colunas complexas
Tamanho dos caracteres
8 a 40 pontos
Formato da tabela (apenas para formato Word)
Tabelas que cumprem as seguintes condições:
Tabelas compostas por quadrados divididos com linhas sólidas
Tabelas com 32 colunas, no máximo
Tabelas com 32 linhas, no máximo
Alguns originais adequados para processamento OCR podem não ser processados adequadamente.
Pode não ser alcançada uma precisão elevada com originais que incluam uma grande quantidade de texto em cada página.
Os carateres podem ser substituídos por carateres não pretendidos ou estar em falta devido à cor de fundo do original, forma e tamanho dos carateres ou carateres inclinados.*
Os parágrafos, quebras de linha ou tabelas podem não ser reproduzidos.*
Algumas partes de ilustrações, fotografias ou impressões seladas podem ser reconhecidos como carateres e ser substituídos por carateres.*
* Quando o Word é selecionado como formato de ficheiro.
6JR0-07H