O processamento de OCR do texto não é executado corretamente

O processamento de OCR do texto pode não ser executado corretamente ao criar um arquivo de texto pesquisável. Neste caso, verifique se a configuração de idioma para processamento de OCR e o original utilizado são apropriados.
Você pode alterar a configuração de idioma de acordo com o original e melhorar a precisão de processamento usando um original com um tipo de caractere e fonte reconhecível pela máquina e usando um original adequado para processamento de OCR.
IMPORTANTE
Quando o processamento de OCR não é executado corretamente, mesmo com uma configuração de idioma e original apropriados
Talvez não seja possível melhorar a precisão do processamento para originais com um grande volume de texto por página.
Observe o seguinte ao criar um arquivo OOXML no formato Word:
O texto pode ser substituído por caracteres não intencionais ou caracteres podem estar faltando dependendo da cor do plano de fundo, fonte, tamanho da fonte, aplicação de formato itálico e outros fatores.
Parágrafos, quebras de linha e tabelas não são reproduzidos.
Algumas imagens, como diagramas, fotos e selos podem ser reconhecidas como texto e substituídas por texto.

Configurações e padrão de idiomas para processamento de OCR

As configurações de idioma padrão para reconhecimento de caracteres
Os idiomas selecionados ao definir o processamento de OCR são a base para o reconhecimento de caracteres. Criando um arquivo pesquisável por texto (processamento OCR)
Idiomas asiáticos reconhecíveis
Japonês, chinês (simplificado), chinês (tradicional), coreano
* Para os tipos de caracteres e fontes, veja o seguinte:
Idiomas europeus e grupos linguísticos reconhecíveis
Idiomas
Inglês, francês, italiano, alemão, espanhol, holandês, português, albanês, catalão, dinamarquês, finlandês, islandês, norueguês, sueco, croata, tcheco, húngaro, polonês, eslovaco, estoniano, letão, lituano, russo, grego, turco, esloveno*1, romeno*1, búlgaro*1, hebraico*1
Grupos de idiomas
Europa Ocidental (ISO)*2, Europa Central (ISO)*3, Báltico (ISO)*4
* Para os tipos de caracteres e fontes, veja o seguinte:
*1 Só pode ser selecionado com [OCR (European Languages)].
*2Inclui inglês, francês, italiano, alemão, espanhol, holandês, português, albanês, catalão, dinamarquês, finlandês, islandês, norueguês e sueco.
*3Inclui inglês, croata, tcheco, húngaro, polonês e eslovaco.
*4Inclui inglês, estoniano, letão e lituano.

Tipos e fontes de caracteres reconhecíveis (idiomas asiáticos)

Tipos de caracteres reconhecíveis
Japonês
Alfabeto, números, kanji*1, símbolos, hiragana e katakana
Chinês (simplificado)
GB2312-80 (alfabeto, números, kanji e símbolos)
Chinês (tradicional)
Big5 (alfabeto, números, kanji e símbolos)
Coreano
KSC5601 (alfabeto, números, kanji, símbolos e Hangul)
Fontes reconhecíveis
Suporte a várias fontes (recomendado: Mincho)
* Caracteres em itálico não podem ser reconhecidos.
Tamanhos de fonte reconhecíveis
8 pontos até 48 pontos.
Fontes usadas após o processamento de OCR*2
Japonês
Caracteres asiáticos: MS Mincho
Caracteres europeus: Century
Chinês (simplificado)
Caracteres asiáticos: SimSun
Caracteres europeus: Calibri
Chinês (tradicional)
Caracteres asiáticos: PMingLiU
Caracteres europeus: Calibri
Coreano
Caracteres asiáticos: Malgun Gothic
Caracteres europeus: Calibri
*1Todos os kanji padrão JIS 1 e alguns kanji padrão JIS 2
*2Somente ao criar um arquivo OOXML no formato Word

Tipos e fontes de caracteres reconhecíveis (idiomas europeus)

Tipos de caracteres reconhecíveis
Alfabeto, caracteres exclusivos do idioma de reconhecimento*1, número, símbolos
Fontes reconhecíveis
Suporte a várias fontes (recomendado: Times, Century, Arial)*2
* Caracteres em itálico podem ser reconhecidos.
Tamanhos de fonte reconhecíveis
6 pontos até 72 pontos.
Fontes usadas após o processamento de OCR*3
Calibri
* Itálic não pode ser reproduzido.
*1Dependendo do idioma, talvez alguns caracteres exclusivos não sejam reconhecidos.
*2As fontes Arial, Times New Roman e Courier New podem ser reconhecidas com [OCR (European Languages)].
*3Somente ao criar um arquivo OOXML no formato Word

Originais adequados para processamento de OCR

Você pode melhorar a precisão do processamento de OCR usando um original adequado para processamento de OCR.
Formato de arquivo do original
Documentos impressos e documentos de processamento de texto
Originais compostos por texto, diagramas, fotos e/ou tabelas e não inclinados
Formato de texto
Escrita horizontal ou vertical (documentos que contêm escrita horizontal e vertical também podem ser reconhecidos)*1
Documentos com uma a três colunas e sem muitas complexidades
Tamanho de fonte
8 pontos até 40 pontos
Formato de tabela*2
Tabelas que sigam as seguintes condições:
Formato retangular composto por linhas de borda sólidas
32 colunas ou menos
32 linhas ou menos
*1Apenas a escrita horizontal pode ser reconhecida para idiomas europeus e coreano.
*2Somente ao criar um arquivo OOXML no formato Word
AK55-086