Si la fonction OCR (recherche de texte possible) ne s'exécute pas correctement

Cette section explique le fonctionnement de la fonction OCR (recherche de texte possible) lors de la création de fichiers PDF/XPS/OOXML permettant la recherche de texte, et le format de fichier adéquat pour la fonction OCR (recherche de texte possible).

Voir les instructions ci-dessous en cas d'incapacité d'obtenir un résultat correct lors de la reconnaissance optique des caractères (OCR).

Fonction OCR (recherche de texte possible) pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

Format de fichier pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

Fonction OCR (recherche de texte possible) pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

Les caractères qui peuvent être traités par OCR sont répertoriés dans le tableau suivant. Si le traitement OCR ne fonctionne pas convenablement, vérifier le type de caractère.

IMPORTANT
Même si la reconnaissance optique des caractères est exécutée dans la même langue que celle utilisée par les originaux, le résultat risque d'être incorrect selon le texte et le format de fichier des originaux.

Rubrique	Exécution de la reconnaissance optique de caractères
Langue de la reconnaissance	Les caractères sont reconnus comme appartenant à l'une des langues ou l'un des groupes de langues suivants selon la langue sélectionnée sous [Changement de langue/clavier] de [Préférences] (Réglages/Enregistrement)1 2
Langues asiatiques	Le texte rédigé dans les langues suivantes est reconnu : Japonais, Chinois (simplifié), Chinois (traditionnel), Coréen
Langues européennes	Le texte rédigé dans les langues ou groupes de langues suivants est reconnu : Langues Anglais, Français, Italien, Allemand, Espagnol, Néerlandais, Portugais, Albanais, Catalan, Danois, Danois, Finnois, Islandais, Norvégien, Suédois, Croate, Tchèque, Hongrois, Polonais, Slovaque, Estonien, Letton, Lituanien, Russe, Grec, Turc Groupes de langues Europe de l'Ouest (ISO), Europe centrale (ISO), Balte (ISO) *3
Reconnaissance des caractères pour les langues asiatiques
Type de caractères de la reconnaissance	Japonais : caractères alphanumériques, caractères Kana, caractères Kanji (JIS premier niveau, JIS deuxième niveau [partiellement]), symboles Chinois (simplifié) : caractères alphanumériques, caractères chinois, symboles (GB2312-80) Chinois (traditionnel) : caractères alphanumériques, caractères chinois, symboles (Big5) Coréen : caractères alphanumériques, caractères Kanji, caractères Hangul coréens, symboles (KSC5601)
Polices de la reconnaissance	Multipolices prises en charge (type Ming-cho conseillé) Les types en italiques ne sont pas reconnus
Reconnaissance des caractères pour les langues européennes
Type de caractères de la reconnaissance	Caractères alphanumériques, caractères spéciaux de la langue reconnue*4, symboles
Polices de la reconnaissance	Multipolices prises en charge (Times, Century et Arial sont conseillées) Les types en italiques peuvent être reconnus

*1 La langue affichée sur la liste des langues sous [Changement de langue/clavier] de [Préférences] (Réglages/Enregistrement) peut varier.

*2 Si Anglais, Français, Italien, Allemand, Espagnol, Thaïlandais ou Vietnamien sous [Changement de langue/clavier] de [Préférences] (Réglages/Enregistrement) est sélectionné, la langue reconnue est pour Europe de l'Ouest (ISO).

*3 Chaque groupe de langues se compose des langues ci-dessous. Si un groupe est choisi, le texte rédigé dans une des langues appartenant au groupe est reconnu.

Europe de l'Ouest (ISO) :	Anglais, Français, Italien, Allemand, Espagnol, Néerlandais, Portugais, Albanais, Catalan, Danois, Danois, Finnois, Islandais, Norvégien, Suédois
Europe centrale (ISO) :	Croate, Tchèque, Hongrois, Polonais, Slovaque
Balte (ISO) :	Estonien, Letton, Lituanien

*4 Si Grec est sélectionné, les caractères spéciaux ci-dessous sont reconnus. Pour les autres langues, les caractères spéciaux de chaque langue peuvent être reconnus. Certains caractères spéciaux ne sont pas reconnus selon les langues.

Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Format de fichier pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

En utilisant un format de fichier correct lors de la reconnaissance optique de caractères, le résultat obtenu peut être plus précis.

Si le résultat n'est pas correct, vérifier que le format de fichier de l'original lu est adapté à la reconnaissance optique des caractères.

IMPORTANT
Si les originaux contiennent une partie importante de texte sur chaque page, la reconnaissance optique des caractères risque de ne pas s'exécuter correctement.

Rubrique	Détails
Format de l'original	Documents imprimés, documents comportant du texte (un document qui contient du texte, des figures, des images, des tableaux et aucun caractère incliné)
Format du texte	Ecritures horizontale et verticale Documents rédigés dans une écriture horizontale et aussi une écriture verticale peuvent être reconnus. Seule l'écriture horizontale peut être reconnue pour les langues européennes et le coréen. Document sans colonne complexe
Taille de caractère	8 à 40 points