Este modo permite que você execute OCR (reconhecimento óptico de caractere) para extrair dados que podem ser reconhecidos como texto a partir de uma imagem digitalizada e criar um arquivo PDF/OOXML (pptx/docx) pesquisável. Também é possível definir <Compact> se o formato de arquivo selecionado é PDF. |
1 | Selecione <PDF> pressione <OCR (Prioritize Speed)> ou <OCR (Prioritize Precision)>. OCR (Prioritize Precision) não poderá ser realizado se <Trace & Smooth> estiver selecionado com <OCR (Prioritize Precision)>. Se você configurar <OCR (Prioritize Precision)> e <Compact>, a configuração <Image Quality Level for Compact> será desativada. <Image Quality Level for Compact> Se você criar um arquivo PDF com <OCR (Prioritize Precision)> e <Compact> configurados, a qualidade da imagem poderá divergir de um arquivo PDF criado com <OCR (Prioritize Speed)> e <Compact> configurados. Para alterar um idioma escolhido para uso com o OCR, pressione <OCR Language> selecione um idioma pressione <OK>. Apenas idiomas europeus podem ser detectados com <OCR (Prioritize Precision)>. Configurações e idiomas para processamento OCR |
1 | Selecione <OOXML> <Word>. Para mudar o idioma escolhido para uso de OCR, pressione <Change> selecione um idioma ou grupo de idiomas pressione <OK>. Selecione um idioma ou grupo de idiomas de acordo com o idioma usado nos documentos digitalizados. |
1 | Selecione <OOXML> <PowerPoint> <OCR (Text Searchable)>. |
2 | Selecione um idioma para usar OCR pressione <OK>. |
Originais de tira longa (25 1/4" (432 mm) ou maior) não podem ser usados com <OCR (Text Searchable)>. |
Se você selecionar <PDF (OCR)> ou <OOXML (OCR)> como formato de arquivo, e <Smart Scan> estiver configurado como <On> em <OCR (Text Searchable) Settings>/<OCR (Prioritize Speed)>, a orientação do original será detectada e o documento será girado automaticamente antes do envio, se necessário. <OCR (Text Searchable) Settings> Se você selecionar <OCR (Text Searchable)>, só será possível enviar a uma taxa de zoom de <Direct>/<1:1> ou <Auto>. Se você selecionar <PDF> como o formato de arquivo, poderá configurar <Compact> e <OCR (Text Searchable)> ao mesmo tempo. Nesse caso, <PDF (Compact)> será exibido como o formato do arquivo na tela de Recursos básicos de digitalização e envio. Se você selecionar <Word> para <OOXML>, poderá configurar para excluir imagens de fundo digitalizadas. É possível gerar arquivos de Word que são fáceis de editar sem imagens indesejadas. <Include Background Images in Word File> Se estiver usando a função <Scan and Store>, a linguagem OCR poderá ser especificada apenas quando <Word> for selecionado para <OOXML> ou <OCR (Prioritize Precision)> for selecionado para <PDF>. |
Item | Detalhes |
Configurações de idioma para reconhecimento de caracteres | Quando um idioma não é especificado com o OCR selecionado em <File Format>: Os caracteres são reconhecidos com base no idioma selecionado para cada formato de arquivo. Quando um idioma não é especificado com o OCR selecionado em <File Format>: Os caracteres são reconhecidos com base no idioma selecionado por você <Switch Language/Keyboard> (<Switch Language/Keyboard>).*1 |
Idiomas asiáticos reconhecíveis*2 | Japonês, chinês (simplificado), chinês (tradicional), coreano Tipos e fontes de caracteres reconhecíveis (Idiomas asiáticos) |
Idiomas europeus e grupos linguísticos reconhecíveis | Idiomas: inglês, francês, italiano, alemão, espanhol, holandês, português, albanês, catalão, dinamarquês, finlandês, islandês, norueguês, sueco, croata, tcheco, húngaro, polonês, eslovaco, estoniano, letão, lituano, russo, grego, turco, esloveno*3, romeno*3, búlgaro*3, hebraico*3 Grupos linguísticos: Europeu Ocidental (ISO)*4, Centro-Europeu (ISO)*5, Báltico (ISO)*6 Tipos e fontes de caracteres reconhecíveis (Idiomas europeus) |
Item | Detalhes |
Tipos de caracteres reconhecíveis | Japonês: caracteres alfanuméricos, caracteres kana, caracteres kanji (primeiro nível de JIS e alguns dos JIS de segundo nível), símbolos Chinês (simplificado): caracteres alfanuméricos, caracteres chineses, símbolos (GB2312-80) Chinês (simplificado): caracteres alfanuméricos, caracteres chineses, símbolos (Big5) Coreano: caracteres alfanuméricos, caracteres chineses, caracteres hangul, símbolos (KSC5601) |
Fontes reconhecíveis | Múltiplas fontes são suportadas. (tipo Ming-cho é recomendado.) Caracteres em itálico não podem ser reconhecidos. |
Fontes usadas para caracteres convertidos (apenas quando Word é selecionado como formato de arquivo) | Japonês: caracteres asiáticos: MS Mincho Caracteres europeus: Century Chinês (simplificado): caracteres asiáticos: SimSun Caracteres europeus: Calibri Chinês (tradicional): caracteres asiáticos: PMingLiU Caracteres europeus: Calibri |
Item | Detalhes |
Tipos de caracteres reconhecíveis | Caracteres alfanuméricos, caracteres especiais do idioma reconhecido*1, símbolos |
Fontes reconhecíveis | Múltiplas fontes são suportadas. (Times, Century e Arial são recomendadas.)*2 Caracteres em itálico podem ser reconhecidos. |
Fontes usadas para caracteres convertidos (apenas quando Word é selecionado como formato de arquivo) | Calibri Estilo itálico não é reproduzido. |
Item | Detalhes |
Formato original | Documentos impressos, documentos de processador Word (documentos consistindo de texto, gráficos, fotografias ou tabelas e sem caracteres oblíquos) |
Formato de texto | Escrita horizontal e vertical (documentos contendo tanto escrita horizontal como vertical podem ser reconhecidos também) Apenas escrita horizontal pode ser reconhecida para idiomas europeus e texto em coreano. Documentos com uma a três colunas sem configurações complexas de coluna |
Tamanho do caractere | 8 a 40 pontos |
Formato de tabela (apenas para formatação do Word) | Tabelas que sigam as seguintes condições: Tabelas consistindo em quadrados divididos por linhas sólidas Tabelas com até 32 colunas Tabelas com até 32 linhas |
Alguns originais compatíveis com processamento OCR podem não ser processados adequadamente.Máxima precisão pode não ser atingida com originais incluindo grande quantidade de texto em cada página. Caracteres podem ser substituídos por caracteres indesejados ou não ser lidos devido a cor de fundo, forma e tamanho dos caracteres do original, ou devido a caracteres inclinados.* Parágrafos, quebras de linha ou tabelas podem não ser reproduzidas.* Algumas partes de ilustrações, fotografias ou impressões de selo podem ser reconhecidas como caracteres e substituídas por caracteres.* * Quando Word for escolhido como o formato de arquivo. |