Ler com a função OCR

Este modo permite executar o OCR (reconhecimento ótico de carateres) para extrair dados que possam ser reconhecidos como texto, a partir da imagem lida, e criar um ficheiro PDF/XPS/OOXML (pptx/docx) pesquisável. Também pode programar <Compacto> se selecionar PDF ou XPS como formato de ficheiro.

Leitura com OCR

Os resultados de OCR não são satisfatórios

Leitura com OCR

Coloque o original. Colocar originais

Carregue em <Ler e Enviar>. Ecrã <Início>

Especifique o destino no ecrã das funções básicas de leitura. Ecrã das funções básicas de leitura

Especifique as programações de leitura conforme necessário. Operações básicas para a leitura de originais

Selecione um formato de ficheiro.

Se quiser dividir várias imagens e enviá-las como ficheiros separados, cada um com uma só página, carregue em <Dividir em páginas>

introduza o número de páginas para a divisão

carregue em <OK>. Se quiser ler as imagens como um único ficheiro, carregue em <Dividir em páginas>

<Cancelar progr.>.

Para selecionar PDF

1	Selecione <PDF> e carregue <Especificar detalhes> <OCR (Texto pesquisável)>.
2	Para alterar um idioma a utilizar para OCR, carregue em <Idioma OCR> selecione um idioma carregue em <OK>.

Para selecionar XPS

1	Selecione <XPS> carregue em <Especificar detalhes> <OCR (Texto pesquisável)>.
2	Para alterar um idioma a utilizar para OCR, carregue em <Idioma OCR> selecione um idioma prima <OK>.

Para selecionar o formato Word para OOXML

1	Selecione <OOXML> selecione <Word> na lista pendente.

Para alterar o idioma a utilizar para OCR, carregue em <Especificar detalhes>

selecione o idioma

carregue em <OK>.

Para selecionar o formato PowerPoint para OOXML

1	Selecione <OOXML> selecione <PowerPoint> na lista pendente.
2	Selecione <Especificar detalhes> <OCR (Texto pesquisável)>.
3	Para alterar um idioma a utilizar para OCR, carregue em <Idioma OCR> selecione um idioma carregue em <OK>.

Carregue em <OK>.


Se selecionar <PDF; OCR>, <XPS; OCR> ou <OOXML; OCR> como formato de ficheiro e se o item <Leitura inteligente> estiver programado para <Ligado> em <Programações OCR (Texto pesquisável)>, a máquina deteta a orientação do original e, se for necessário, roda o documento automaticamente antes de o enviar. <Programações OCR (Texto pesquisável)> Se selecionar <PDF> ou <XPS> como formato de ficheiro, pode programar <Compacto> e <OCR (Texto pesquisável)> ao mesmo tempo. Nesse caso, <PDF; Compacto> ou <XPS; Compacto> aparece como formato de ficheiro no ecrã de funções básicas de Ler e Enviar. Se selecionar <Word> para <OOXML>, pode programar a eliminação das imagens de fundo lidas. Pode criar ficheiros do Word que são fáceis de editar sem imagens desnecessárias. <Incluir imagens de fundo no ficheiro Word> Selecione um idioma ou um grupo de acordo com o idioma utilizado nos originais para ler. Programações e idiomas para processamento OCR

Se selecionar <PDF; OCR>, <XPS; OCR> ou <OOXML; OCR> como formato de ficheiro e se o item <Leitura inteligente> estiver programado para <Ligado> em <Programações OCR (Texto pesquisável)>, a máquina deteta a orientação do original e, se for necessário, roda o documento automaticamente antes de o enviar. <Programações OCR (Texto pesquisável)>

Se selecionar <PDF> ou <XPS> como formato de ficheiro, pode programar <Compacto> e <OCR (Texto pesquisável)> ao mesmo tempo. Nesse caso, <PDF; Compacto> ou <XPS; Compacto> aparece como formato de ficheiro no ecrã de funções básicas de Ler e Enviar.

Se selecionar <Word> para <OOXML>, pode programar a eliminação das imagens de fundo lidas. Pode criar ficheiros do Word que são fáceis de editar sem imagens desnecessárias. <Incluir imagens de fundo no ficheiro Word>

Selecione um idioma ou um grupo de acordo com o idioma utilizado nos originais para ler. Programações e idiomas para processamento OCR

Os resultados de OCR não são satisfatórios

Quando cria ficheiros PDF/XPS/OOXML com texto pesquisável, o OCR (Reconhecimento ótico de carateres) pode não ser corretamente processado. Pode dever-se ao facto de as programações na máquina, ou o idioma, tipo de caráter ou formato do documento original não serem adequados para processamento OCR.

Verificar as programações da máquina e idiomas suportados

É possível melhorar o processamento OCR personalizando as programações da máquina no que diz respeito ao reconhecimento de carateres de acordo com os originais ou utilizando tipos de carateres ou tipos de letra adequados nos originais de modo que a máquina consiga reconhecer os carateres.

Programações e idiomas para processamento OCR

Item	Detalhes
Programações de idioma para reconhecimento de carateres	Quando é especificado um idioma com OCR selecionado em <Formato fich.>: Os carateres são reconhecidos com base no idioma selecionado para cada formato de ficheiro. Quando não é especificado um idioma com OCR selecionado em <Formato fich.>: Os carateres são reconhecidos com base no idioma selecionado em <Comutação idioma/teclado> (<Comutação idioma/teclado>).*1
Idiomas asiáticos reconhecíveis	Japonês, Chinês (Simplificado), Chinês (Tradicional), Coreano Tipos de carateres e tipos de letra reconhecíveis (idiomas asiáticos)
Idiomas e grupos de idiomas europeus reconhecíveis	Idiomas: Inglês, Francês, Italiano, Alemão, Espanhol, Neerlandês, Português, Albanês, Catalão, Dinamarquês, Finlandês, Islandês, Norueguês, Sueco, Croata, Checo, Húngaro, Polaco, Eslovaco, Estónio, Letão, Lituano, Russo, Grego, Turco Grupos de idiomas: Europeu Ocidental (ISO)2, Europeu Central (ISO)3, Báltico (ISO)*4 Tipos de carateres e tipos de letra reconhecíveis (idiomas europeus)

*1 Os idiomas mostrados na lista podem ser diferentes. Se selecionar Inglês, Francês, Italiano, Alemão, Espanhol, Tailandês ou Vietnamita, o idioma selecionado é reconhecido como Europeu Ocidental (ISO).

*2 Incluindo inglês, francês, italiano, alemão, espanhol, neerlandês, português, albanês, catalão, dinamarquês, finlandês, islandês, norueguês e sueco.

*3 Incluindo Croata, Checo, Húngaro, Polaco e Eslovaco.

*4 Incluindo Estónio, Letão e Lituano.

Tipos de carateres e tipos de letra reconhecíveis (idiomas asiáticos)

Item	Detalhes
Tipos de carateres reconhecíveis	Japonês: carateres alfanuméricos, carateres Kana, carateres Kanji (JIS primeiro nível e alguns JIS segundo nível), símbolos Chinês (simplificado): carateres alfanuméricos, carateres chineses, símbolos (GB2312-80) Chinês (tradicional): carateres alfanuméricos, carateres chineses, símbolos (Big5) Coreano: carateres alfanuméricos, carateres chineses, carateres Hangul, símbolos (KSC5601)
Tipos de letra reconhecíveis	São suportados vários tipos de letra. (recomendado o tipo Ming-cho.) Os carateres em itálico podem não ser reconhecidos.
Tipos de letra utilizados para carateres convertidos (apenas quando o Word está selecionado como formato de ficheiro)	Japonês: carateres asiáticos: MS Mincho Carateres europeus: Century Chinês (Simplificado): Carateres asiáticos: SimSun Carateres europeus: Calibri Chinês (Tradicional): Carateres asiáticos: PMingLiU Carateres europeus: Calibri

Tipos de carateres e tipos de letra reconhecíveis (idiomas europeus)

Item	Detalhes
Tipos de carateres reconhecíveis	Carateres alfanuméricos, carateres especiais do idioma reconhecido*, símbolos
Tipos de letra reconhecíveis	São suportados vários tipos de letra. (recomendados Times, Century e Arial.) Os carateres em itálico podem ser reconhecidos.
Tipos de letra utilizados para carateres convertidos (apenas quando o Word está selecionado como formato de ficheiro)	Calibri O estilo itálico não é reproduzido.

* Os seguintes carateres especiais gregos podem ser reconhecidos. Os carateres especiais de cada idioma também podem ser reconhecidos. Alguns carateres especiais podem não ser reconhecidos, consoante os idiomas.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Verificar o formato dos documentos originais

Utilize originais adequados para processamento OCR para melhorar a precisão de processamento ao criar ficheiros PDF/XPS/OOXML pesquisáveis.

Item	Detalhes
Formato do original	Documentos impressos, documentos de processador Word (documentos compostos por texto, gráficos, fotografias ou tabelas e sem inclinação dos carateres)
Formato de texto	Escrita horizontal e vertical (documentos que contêm escrita horizontal e vertical também podem ser reconhecidos) Para o texto europeu e coreano apenas pode ser reconhecida escrita horizontal. Documentos com uma a três colunas sem programações de colunas complexas
Tamanho dos caracteres	8 a 40 pontos
Formato da tabela (apenas para formato Word)	Tabelas que cumprem as seguintes condições: Tabelas compostas por quadrados divididos com linhas sólidas Tabelas com 32 colunas, no máximo Tabelas com 32 linhas, no máximo


Alguns originais adequados para processamento OCR podem não ser processados adequadamente. Pode não ser alcançada uma precisão elevada com originais que incluam uma grande quantidade de texto em cada página. Os carateres podem ser substituídos por carateres não pretendidos ou estar em falta devido à cor de fundo do original, forma e tamanho dos carateres ou carateres inclinados.* Os parágrafos, quebras de linha ou tabelas podem não ser reproduzidos.* Algumas partes de ilustrações, fotografias ou impressões seladas podem ser reconhecidos como carateres e ser substituídos por carateres.* * Quando o Word é selecionado como formato de ficheiro.

Alguns originais adequados para processamento OCR podem não ser processados adequadamente.

Pode não ser alcançada uma precisão elevada com originais que incluam uma grande quantidade de texto em cada página.

Os carateres podem ser substituídos por carateres não pretendidos ou estar em falta devido à cor de fundo do original, forma e tamanho dos carateres ou carateres inclinados.*

Os parágrafos, quebras de linha ou tabelas podem não ser reproduzidos.*

Algumas partes de ilustrações, fotografias ou impressões seladas podem ser reconhecidos como carateres e ser substituídos por carateres.*

* Quando o Word é selecionado como formato de ficheiro.