Este modo permite que você execute OCR (reconhecimento óptico de caractere) para extrair dados que podem ser reconhecidos como texto a partir de uma imagem digitalizada e criar um arquivo PDF/XPS/OOXML (pptx/docx) pesquisável. Também é possível definir <Compacto> se o formato de arquivo selecionado é PDF ou XPS. |
1 | Selecione <PDF> pressione <Especificar detalhes> <OCR (Texto pesquisável)>. |
2 | Para alterar um idioma escolhido para uso com o OCR, pressione <Idioma OCR> selecione um idioma pressione <OK>. |
1 | Selecione <OOXML> selecione <Word> na lista suspensa. |
1 | Selecione <OOXML> selecione <PowerPoint> na lista suspensa. |
2 | Selecione <Especificar detalhes> <OCR (Texto pesquisável)>. |
3 | Para alterar um idioma escolhido para uso com o OCR, pressione <Idioma OCR> selecione um idioma pressione <OK>. |
Se você selecionar <PDF; OCR> ou <XPS; OCR> como formato de arquivo, e <OOXML; OCR> estiver configurado como <Leitura inteligente> em <On>, a orientação do original será detectada e o documento será automaticamente rotado caso necessário antes de ser enviado. Programações OCR (Texto pesquisável) Se você selecionar <PDF> como o formato de arquivo, poderá configurar <Compacto> e <OCR (Texto pesquisável)> ao mesmo tempo. Nesse caso, <PDF; Compacto> será exibido como o formato do arquivo na tela de Recursos básicos de digitalização. Se você selecionar <Word> para <OOXML>, poderá configurar para excluir imagens de fundo digitalizadas. É possível gerar arquivos de Word que são fáceis de editar sem imagens indesejadas. <Incluir imagens de fundo no ficheiro Word> Selecione um idioma ou grupo de acordo com o idioma usado nos originais a digitalizar. Configurações e idiomas para processamento OCR |
Item | Detalhes |
Configurações de idioma para reconhecimento de caracteres | Quando um idioma não é especificado com o OCR selecionado em <Formato fich.>: Os caracteres são reconhecidos com base no idioma selecionado para cada formato de arquivo. Quando um idioma não é especificado com o OCR selecionado em <Formato fich.>: Os caracteres são reconhecidos com base no idioma selecionado por você <Comutação idioma/teclado> (<Comutação idioma/teclado>).*1 |
Idiomas asiáticos reconhecíveis | Japonês, chinês (simplificado), chinês (tradicional), coreano Tipos e fontes de caracteres reconhecíveis (Idiomas asiáticos) |
Idiomas europeus e grupos linguísticos reconhecíveis | Idiomas: inglês, francês, italiano, alemão, espanhol, holandês, português, albanês, catalão, dinamarquês, finlandês, islandês, norueguês, sueco, croata, tcheco, húngaro, polonês, eslovaco, estoniano, letão, lituano, russo, grego, turco Grupos linguísticos: Europeu Ocidental (ISO)*2, Centro-Europeu (ISO)*3, Báltico (ISO)*4 Tipos e fontes de caracteres reconhecíveis (Idiomas europeus) |
Item | Detalhes |
Tipos de caracteres reconhecíveis | Japonês: caracteres alfanuméricos, caracteres kana, caracteres kanji (primeiro nível de JIS e alguns dos JIS de segundo nível), símbolos Chinês (simplificado): caracteres alfanuméricos, caracteres chineses, símbolos (GB2312-80) Chinês (simplificado): caracteres alfanuméricos, caracteres chineses, símbolos (Big5) Coreano: caracteres alfanuméricos, caracteres chineses, caracteres hangul, símbolos (KSC5601) |
Fontes reconhecíveis | Múltiplas fontes são suportadas. (tipo Ming-cho é recomendado.) Caracteres em itálico não podem ser reconhecidos. |
Fontes usadas para caracteres convertidos (apenas quando Word é selecionado como formato de arquivo) | Japonês: caracteres asiáticos: MS Mincho Caracteres europeus: Century Chinês (simplificado): caracteres asiáticos: SimSun Caracteres europeus: Calibri Chinês (tradicional): caracteres asiáticos: PMingLiU Caracteres europeus: Calibri |
Item | Detalhes |
Tipos de caracteres reconhecíveis | Caracteres alfanuméricos, caracteres especiais do idioma reconhecido*, Símbolos |
Fontes reconhecíveis | Múltiplas fontes são suportadas. (Times, Century e Arial são recomendadas.) Caracteres em itálico podem ser reconhecidos. |
Fontes usadas para caracteres convertidos (apenas quando Word é selecionado como formato de arquivo) | Calibri Estilo itálico não é reproduzido. |
Item | Detalhes |
Formato original | Documentos impressos, documentos de processador Word (documentos consistindo de texto, gráficos, fotografias ou tabelas e sem caracteres oblíquos) |
Formato de texto | Escrita horizontal e vertical (documentos contendo tanto escrita horizontal como vertical podem ser reconhecidos também) Apenas escrita horizontal pode ser reconhecida para idiomas europeus e texto em coreano. Documentos com uma a três colunas sem configurações complexas de coluna |
Tamanho do caractere | 8 a 40 pontos |
Formato de tabela (apenas para formatação do Word) | Tabelas que sigam as seguintes condições: Tabelas consistindo em quadrados divididos por linhas sólidas Tabelas com até 32 colunas Tabelas com até 32 linhas |
Alguns originais compatíveis com processamento OCR podem não ser processados adequadamente.Máxima precisão pode não ser atingida com originais incluindo grande quantidade de texto em cada página. Caracteres podem ser substituídos por caracteres indesejados ou não ser lidos devido a cor de fundo, forma e tamanho dos caracteres do original, ou devido a caracteres inclinados.* Parágrafos, quebras de linha ou tabelas podem não ser reproduzidas.* Algumas partes de ilustrações, fotografias ou impressões de selo podem ser reconhecidas como caracteres e substituídas por caracteres.* * Quando Word for escolhido como o formato de arquivo. |