Si l'OCR (text per a cerques) funciona inadequadament

Aquesta secció explica com funciona la funció d'OCR (text per a cerques) quan es creen fitxers PDF/XPS/OOXML recognoscibles i sobre el format de fitxer adequat per a la funció d'OCR (text per a cerques).
Consulteu les instruccions següents si no podeu obtenir el resultat apropiat d'OCR (reconeixement òptic de caràcters).

Funció d'OCR (text per a cerques) per crear fitxers PDF/XPS/OOXML recognoscibles

Quan es creen fitxers PDF/XPS/OOXML recognoscibles, el rendiment d'OCR varia, segons el format de fitxer seleccionat. Vegeu la taula següent per obtenir informació detallada.
IMPORTANT
Encara que dugueu a terme l'OCR d'acord amb un idioma utilitzat als originals, és possible que no s'obtingui el resultat adequat, segons el text i el format de fitxer dels originals.
Element
Format de fitxer
PDF/XPS/PowerPoint
Word
Idioma de reconeixement
Els caràcters es reconeixen com un dels següents idiomes o grups d'idiomes segons l'idioma seleccionat a [Canviar idioma/teclat] a [Preferències] (Configuració)*1 *2
Premeu [Canviar] per seleccionar un idioma utilitzar als originals entre els idiomes o grups d'idiomes següents. Els caràcters es reconeixen segons l'idioma seleccionat.
Idiomes asiàtics
Es reconeix el text en els idiomes següents:
japonès, xinès (simplificat), xinès (tradicional), coreà
Idiomes europeus
Es reconeix el text en els idiomes o grups d'idiomes següents:
Idiomes
Anglès, francès, italià, alemany, espanyol, holandès, portuguès, albanès, català, danès, finès, islandès, noruec, suec, croat, txec, hongarès, polonès, eslovac, estonià, letó, lituà, rus, grec, turc
Grups d'idiomes
Europeu occidental (ISO), europeu central (ISO), bàltic (ISO) *3
Reconeixement de caràcters per a idiomes asiàtics
Tipus de reconeixement de caràcters
Japonès: caràcters alfanumèrics, caràcters Kana, caràcters Kanji (primer nivell de JIS, segon nivell de JIS (parcialment)), símbols
Xinès (simplificat): caràcters alfanumèrics, caràcters xinesos, símbols (GB2312-80)
Xinès (tradicionals): caràcters alfanumèrics, caràcters xinesos, símbols (Big5)
Coreà: caràcters alfanumèrics, caràcters Kanji, caràcters Hangul coreans, símbols (KSC5601)
Font de reconeixement
Compatibilitat amb diverses fonts (es recomana el tipus Ming-cho)
No es pot reconèixer el tipus cursiva
Font convertida
-
Si heu seleccionat Japonès:
Text asiàtic: MS Mincho
Text europeu: Century
Si heu seleccionat Xinès (simplificat):
Text asiàtic: SimSun
Text europeu: Calibri
Si heu seleccionat Xinès (tradicional):
Text asiàtic: PMingLiU
Text europeu: Calibri
Reconeixement de caràcters per a idiomes europeus
Tipus de reconeixement de caràcters
Caràcters alfanumèrics, caràcters especials de l'idioma reconegut*4, símbols
Font de reconeixement
Compatibilitat amb diverses fonts (es recomana Times, Century i Arial)
Es pot reconèixer el tipus cursiva
Font convertida
-
Es mostra en Calibli
El tipus cursiva no es pot convertir
*1 L'idioma mostrat a la llista d'idiomes a [Canviar idioma/teclat] a [Preferències] (Configuració) pot variar.
*2 Si seleccioneu anglès, francès, italià, alemany, espanyol, tailandès o vietnamita a [Canviar idioma/teclat] a [Preferències] (Configuració), l'idioma es reconeix com a europeu occidental (ISO).
*3 Cada grup d'idiomes compta amb els següents idiomes. Si seleccioneu un grup d'idiomes, es reconeix el text escrit en idiomes del grup.
Europeu occidental (ISO):
anglès, francès, italià, alemany, espanyol, holandès, portuguès, albanès, català, danès, finès, islandès, noruec, suec
Europeu central (ISO):
croat, txec, hongarès, polonès, eslovac
Bàltic (ISO):
estonià, letó, lituà
*4 Si seleccioneu grec, es poden reconèixer els següents caràcters especials. Si seleccioneu altres idiomes, es poden reconèixer els caràcters especials de cada idioma. Alguns caràcters especials no es poden reconèixer, segons els idiomes.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Format de fitxer per crear fitxers PDF/XPS/OOXML recognoscibles

Si utilitzeu un format de fitxer adequat per a l'OCR, podeu millorar la precisió del resultat de l'OCR.
Si no podeu obtenir un resultat adequat, confirmeu que el format del fitxer de l'original llegit és adequat per a l'OCR.
IMPORTANT
Si utilitzeu originals que contenen una gran quantitat de text per pàgina, és possible que l'OCR no funcioni correctament.
Quan seleccioneu el format Word, pot ser que l'OCR no funcioni correctament fins i tot si utilitzeu originals en el format de fitxer recomanat.
Segons el color de fons, l'estil, la mida i la inclinació del caràcter, pot ser que alguns caràcters se substitueixin incorrectament o faltin al resultat de l'OCR.
Pot ser que els paràgrafs, els salts de línia i les taules no es reconeguin.
Una part d'una imatge, com ara gràfics, fotos, o impressions de segells, es pot reconèixer i substituir per text.
Element
Detalls
Format de l'original
Documents impresos, documents de text (un document que està format per text, xifres, imatges, taules i sense caràcters inclinats)
Format del text
Escriptura horitzontal, escriptura vertical
Es poden reconèixer documents que continguin tant escriptura horitzontal com vertical.
Per als idiomes europeus i el coreà, només es reconeix l'escriptura horitzontal.
Documents sense columnes complexes
Mida dels caràcters
Entre 8 i 40 punts
Format de taula
(només per a documents Word)
Taules que compleixen les condicions següents
Taules quadrades amb línies sòlides
El nombre de files és 32 o menys
El nombre de columnes és 32 o menys
6Y5C-0SE