Si OCR (texto para búsquedas) no funciona adecuadamente

En esta sección se explica cómo trabaja a función OCR (texto para búsquedas) cuando se crean archivos PDF/XPS/OOXML para búsquedas, y el formato de archivo adecuado para la función OCR (texto para búsquedas).
Si no puede obtener el resultado apropiado de OCR (texto para búsquedas), consulte las siguientes instrucciones.

OCR (texto para búsquedas)

Los caracteres que se pueden procesar con OCR aparecen enumerados en la siguiente tabla. Si el proceso de OCR no funciona correctamente, compruebe el tipo de carácter.
IMPORTANTE
Aunque realice OCR de acuerdo con el idioma utilizado en los originales, es posible que no obtenga el resultado apropiado dependiendo del texto y del formato de archivo de los originales.
Elemento
Formato de archivo
PDF/XPS/PowerPoint
Word
Idioma de reconocimiento
Los caracteres se reconocen como uno de los idiomas siguientes o grupos de idiomas de acuerdo con el idioma seleccionado en [Cambio de idioma/teclado] en [Preferencias] (Configuración)*1 *2
Pulse [Cambiar] para seleccionar un idioma utilizado en los originales entre los idiomas siguientes o grupos de idiomas. Los caracteres se reconocerán de acuerdo con el idioma seleccionado.
Idiomas asiáticos
Se reconoce texto en los idiomas siguientes:
Japonés, Chino (Simplificado), Chino (Tradicional), Coreano
Idiomas europeos
Se reconoce texto en los idiomas o grupos de idiomas siguientes
Idiomas
Inglés, francés, italiano, alemán, español, holandés, portugués, albanés, catalán, danés, finlandés, islandés, noruego, sueco, croata, checo, húngaro, polaco, eslovaco, estonio, letón, lituano, ruso, griego, turco
Grupos de idiomas
Europeo occidental (ISO), Centroeuropeo (ISO), Báltico (ISO) *3
Reconocimiento de caracteres para idiomas asiáticos
Tipo de caracteres para reconocimiento
Japonés: Caracteres alfanuméricos, caracteres Kana, caracteres Kanji (primer nivel de JIS, segundo nivel de JIS (parcialmente)), símbolos
Chino (Simplificado): Caracteres alfanuméricos, caracteres chinos, símbolos (GB2312-80)
Chino (Tradicional): Caracteres alfanuméricos, caracteres chinos, símbolos (Big5)
Coreano: Caracteres alfanuméricos, caracteres Kanji, caracteres coreanos Hangul, símbolos (KSC5601)
Fuente de reconocimiento
Fuentes múltiples admitidas (se recomienda el tipo Ming-cho)
El tipo de letra cursiva no puede reconocerse
Fuente convertida
-
Cuando se seleccione japonés:
Texto asiático: MS Mincho
Texto europeo: Century
Cuando se seleccione chino (simplificado):
Texto asiático: SimSun
Texto europeo: Calibri
Cuando se seleccione chino (tradicional):
Texto asiático: PMingLiU
Texto europeo: Calibri
Reconocimiento de caracteres para idiomas europeos
Tipo de caracteres para reconocimiento
Caracteres alfanuméricos, caracteres especiales del idioma reconocido*4, símbolos
Fuente de reconocimiento
Fuentes múltiples admitidas (se recomiendan Times, Century, y Arial)
El tipo de letra cursiva puede reconocerse
Fuente convertida
-
Visualizado en Calibi
El tipo de letra cursiva no puede convertirse
*1 El idioma visualizado en la lista de idiomas de [Cambio de idioma/teclado] en [Preferencias] (Configuración) puede diferir.
*2 Si selecciona inglés, francés, italiano, alemán, español, tailandés, o vietnamita en [Cambio de idioma/teclado] en [Preferencias] (Configuración), el idioma se reconocerá como Europeo occidental (ISO).
*3 Cada grupo de idiomas consta de los idiomas siguientes. Si selecciona un grupo de idiomas, el texto escrito en idiomas del grupo de idiomas se reconocerá.
Europeo occidental (ISO):
Inglés, francés, italiano, alemán, español, holandés, portugués, albanés, catalán, danés, finlandés, islandés, noruego, sueco
Centroeuropeo (ISO):
Croata, checo, húngaro, polaco, eslovaco
Báltico (ISO):
Estonio, letón, lituano
*4 Si selecciona Griego, podrán reconocerse los caracteres siguientes. Si selecciona otros idiomas, podrán reconocerse caracteres especiales para cada idioma. Algunos caracteres especiales pueden no reconocerse dependiendo de los idiomas.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Formatos de originales

Utilizando el formato de archivo apropiado para OCR, podrá mejorar la precisión del resultado de OCR.
Si no puede obtener el resultado apropiado de OCR, confirme que el formato de archivo del original leído sea apropiado para OCR.
IMPORTANTE
Si utiliza originales que contengan gran cantidad de texto por página, el OCR puede no realizarse apropiadamente.
Cuando seleccione el formato Word, el OCR puede no realizarse adecuadamente aunque utilice originales en el formato recomendado.
Dependiendo del color de fondo, el estilo de caracteres, el tamaño de caracteres, y la orientación de caracteres, algunos caracteres pueden reemplazarse incorrectamente o pueden perderse en el resultado del OCR.
Los párrafos, cambios de línea, y tablas del original pueden no reconocerse.
Una parte de una imagen pude reconocerse y reemplazarse por texto.
Elemento
Detalles
Formato del original
Documentos impresos, documentos de texto (documento compuesto por texto, figuras, imágenes, tablas, y caracteres sin orientación)
Formato de texto
Escritura horizontal, escritura vertical
Pueden reconocerse documentos que contienen tanto escritura horizontal como vertical.
Para idiomas europeos y coreano sólo puede reconocerse escritura horizontal.
Documento con columnas complicadas
Tamaño de caracteres
8 a 40 puntos
Formato de tabla
(sólo para documentos Word)
Tablas que cumplen las condiciones siguientes
Tablas cuadradas con líneas continuas
El número de filas es de 32 o menos
El número de columnas es de 32 o menos
12KS-0K2