Se o OCR (texto pesquisável) for realizado inadequadamente

Esta secção explica como funciona o modo OCR (texto pesquisável) ao criar ficheiros PDF/XPS/OOXML pesquisáveis e fornece informações sobre o formato de ficheiro adequado para a função OCR (texto pesquisável).
Consulte as instruções seguintes se não conseguir obter um resultado de OCR (reconhecimento ótico de carateres) adequado.

Função OCR (texto pesquisável) para criação de ficheiros PDF/XPS/OOXML pesquisáveis

Ao criar ficheiros PDF/XPS/OOXML pesquisáveis, o desempenho de OCR varia consoante o formato de ficheiro selecionado. Para obter detalhes, consulte a tabela abaixo.
IMPORTANTE
Mesmo que realize o OCR de acordo com o idioma utilizado nos originais, pode não ser possível obter um resultado adequado, dependendo do texto e do formato de ficheiro dos originais.
Item
Formato de Arquivo
PDF/XPS/PowerPoint
Word
Idioma de reconhecimento
Os caracteres são reconhecidos como um dos seguintes idiomas ou grupos de idiomas de acordo com o idioma selecionado em [Comutação idioma/teclado] em [Preferências] (Programações/Gravação)*1 *2
Carregue em [Alterar] para selecionar um idioma utilizado nos originais a partir dos seguintes idiomas ou grupos de idiomas. Os caracteres são reconhecidos de acordo com o idioma selecionado.
Idiomas asiáticos
É reconhecido texto nos seguintes idiomas:
Japonês, Chinês (Simplificado), Chinês (Tradicional), Coreano
Idiomas europeus
É reconhecido texto nos seguintes idiomas ou grupos de idiomas:
Idiomas
Inglês, Francês, Italiano, Alemão, Espanhol, Neerlandês, Português, Albanês, Catalão, Dinamarquês, Finlandês, Islandês, Norueguês, Sueco, Croata, Checo, Húngaro, Polaco, Eslovaco, Estónio, Letão, Lituano, Russo, Grego, Turco
Grupos de idiomas
Europeu Ocidental (ISO), Europeu Central (ISO), Báltico (ISO) *3
Reconhecimento de caracteres para idiomas asiáticos
Tipo de caracteres reconhecidos
Japonês:Caracteres alfanuméricos, caracteres Kana, caracteres Kanji (JIS primeiro nível, JIS segundo nível (parcial)), símbolos
Chinês (Simplificado):Caracteres alfanuméricos, caracteres chineses, símbolos (GB2312-80)
Chinês (Tradicional):Caracteres alfanuméricos, caracteres chineses, símbolos (Big5)
Coreano:Caracteres alfanuméricos, caracteres Kanji, caracteres Korean Hangul, símbolos (KSC5601)
Tipos de letra reconhecidos
Suportados tipos de letra múltiplos (recomendado tipo Ming-cho)
O tipo itálico não pode ser reconhecido
Tipo de letra convertido
-
Quando é selecionado Japonês:
Texto asiático:MS Mincho
Texto europeu:Century
Quando é selecionado Chinês (Simplificado):
Texto asiático:SimSun
Texto europeu:Calibri
Quando é selecionado Chinês (Tradicional):
Texto asiático:PMingLiU
Texto europeu:Calibri
Reconhecimento de caracteres para idiomas europeus
Tipo de caracteres reconhecidos
Caracteres alfanuméricos, caracteres especiais do idioma reconhecido*4, símbolos
Tipos de letra reconhecidos
Suportados tipos de letra múltiplos (recomendados Times, Century e Arial)
O tipo itálico pode ser reconhecido
Tipo de letra convertido
-
Apresentado em Calibli
O tipo itálico não pode ser convertido
*1 O idioma apresentado na lista de idiomas em [Comutação idioma/teclado] em [Preferências] (Programações/Gravação) pode variar.
*2 Se selecionar Inglês, Francês, Italiano, Alemão, Espanhol, Tailandês ou Vietnamita em [Comutação idioma/teclado] em [Preferências] (Programações/Gravação), o idioma é reconhecido como Europeu Ocidental (ISO).
*3 Cada grupo de idiomas é composto pelos seguintes idiomas. Se selecionar um grupo de idiomas, é reconhecido o texto escrito nos idiomas do grupo de idiomas.
Europeu Ocidental (ISO):
Inglês, Francês, Italiano, Alemão, Espanhol, Neerlandês, Português, Albanês, Catalão, Dinamarquês, Finlandês Islandês, Norueguês, Sueco
Europeu Central (ISO):
Croata, Checo, Húngaro, Polaco, Eslovaco
Báltico (ISO):
Estónio, Letão, Lituano
*4 Se selecionar Grego, podem ser reconhecidos os seguintes caracteres especiais. Se selecionar outros idiomas, podem ser reconhecidos os caracteres especiais para cada idioma. Alguns caracteres especiais não podem ser reconhecidos, consoante os idiomas.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Formato de ficheiro para criação de ficheiros PDF/XPS/OOXML pesquisáveis

Ao utilizar um formato de ficheiro adequado para OCR, é possível melhorar a precisão do resultado de OCR.
Se não for possível obter um resultado de OCR adequado, confirme que o formato de ficheiro dos originais lidos é adequado para OCR.
IMPORTANTE
Se utilizar originais que contenham uma grande quantidade de texto por página, o OCR pode não ser realizado corretamente.
Se selecionar o formato Word, o OCR pode não ser realizado corretamente mesmo que utilize originais no formato de ficheiro recomendado.
Consoante a cor do fundo, o estilo dos caracteres, o tamanho dos caracteres e a inclinação dos caracteres, alguns caracteres poderão ser substituídos incorretamente ou poderão não aparecer no resultado do OCR.
Os parágrafos, quebras e tabelas do original poderão não ser reconhecidos.
Uma parte de uma imagem, como gráficos, fotografias ou impressões seladas, poderá ser reconhecida e substituída por texto.
Item
Detalhes
Formato do original
Documentos impressos, documentos de texto (um documento composto por texto, figuras, imagens, tabelas e sem inclinação dos caracteres)
Formato de texto
Escrita horizontal, escrita vertical
Os documentos que contêm escrita horizontal e escrita vertical podem ser reconhecidos.
Para os idiomas europeus e coreano apenas pode ser reconhecida escrita horizontal.
Documento sem colunas complexas
Tamanho dos caracteres
8 a 40 pontos
Formato da tabela
(apenas para documentos Word)
Tabelas que cumprem as seguintes condições
Tabelas quadradas com linhas sólidas
O número de linhas é igual ou inferior a 32
O número de colunas é igual ou inferior a 32
6Y5K-0SE