Si la fonction OCR (recherche de texte possible) ne s'exécute pas correctement

Cette section explique le fonctionnement de la fonction OCR (recherche de texte possible) lors de la création de fichiers PDF/XPS/OOXML permettant la recherche de texte, et le format de fichier adéquat pour la fonction OCR (recherche de texte possible).
Voir les instructions ci-dessous en cas d'incapacité d'obtenir un résultat correct lors de la reconnaissance optique des caractères (OCR).

Fonction OCR (recherche de texte possible) pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

Les caractères qui peuvent être traités par OCR sont répertoriés dans le tableau suivant. Si le traitement OCR ne fonctionne pas convenablement, vérifier le type de caractère.
IMPORTANT
Même si la reconnaissance optique des caractères est exécutée dans la même langue que celle utilisée par les originaux, le résultat risque d'être incorrect selon le texte et le format de fichier des originaux.
Rubrique
Exécution de la reconnaissance optique de caractères
Langue de la reconnaissance
Les caractères sont reconnus comme appartenant à l'une des langues ou l'un des groupes de langues suivants selon la langue sélectionnée sous [Changement de langue/clavier] de [Préférences] (Réglages/Enregistrement)*1 *2
Langues asiatiques
Le texte rédigé dans les langues suivantes est reconnu : Japonais, Chinois (simplifié), Chinois (traditionnel), Coréen
Langues européennes
Le texte rédigé dans les langues ou groupes de langues suivants est reconnu :
Langues
Anglais, Français, Italien, Allemand, Espagnol, Néerlandais, Portugais, Albanais, Catalan, Danois, Danois, Finnois, Islandais, Norvégien, Suédois, Croate, Tchèque, Hongrois, Polonais, Slovaque, Estonien, Letton, Lituanien, Russe, Grec, Turc
Groupes de langues
Europe de l'Ouest (ISO), Europe centrale (ISO), Balte (ISO) *3
Reconnaissance des caractères pour les langues asiatiques
Type de caractères de la reconnaissance
Japonais : caractères alphanumériques, caractères Kana, caractères Kanji (JIS premier niveau, JIS deuxième niveau [partiellement]), symboles
Chinois (simplifié) : caractères alphanumériques, caractères chinois, symboles (GB2312-80)
Chinois (traditionnel) : caractères alphanumériques, caractères chinois, symboles (Big5)
Coréen : caractères alphanumériques, caractères Kanji, caractères Hangul coréens, symboles (KSC5601)
Polices de la reconnaissance
Multipolices prises en charge (type Ming-cho conseillé)
Les types en italiques ne sont pas reconnus
Reconnaissance des caractères pour les langues européennes
Type de caractères de la reconnaissance
Caractères alphanumériques, caractères spéciaux de la langue reconnue*4, symboles
Polices de la reconnaissance
Multipolices prises en charge (Times, Century et Arial sont conseillées)
Les types en italiques peuvent être reconnus
*1 La langue affichée sur la liste des langues sous [Changement de langue/clavier] de [Préférences] (Réglages/Enregistrement) peut varier.
*2 Si Anglais, Français, Italien, Allemand, Espagnol, Thaïlandais ou Vietnamien sous [Changement de langue/clavier] de [Préférences] (Réglages/Enregistrement) est sélectionné, la langue reconnue est pour Europe de l'Ouest (ISO).
*3 Chaque groupe de langues se compose des langues ci-dessous. Si un groupe est choisi, le texte rédigé dans une des langues appartenant au groupe est reconnu.
Europe de l'Ouest (ISO) :
Anglais, Français, Italien, Allemand, Espagnol, Néerlandais, Portugais, Albanais, Catalan, Danois, Danois, Finnois, Islandais, Norvégien, Suédois
Europe centrale (ISO) :
Croate, Tchèque, Hongrois, Polonais, Slovaque
Balte (ISO) :
Estonien, Letton, Lituanien
*4 Si Grec est sélectionné, les caractères spéciaux ci-dessous sont reconnus. Pour les autres langues, les caractères spéciaux de chaque langue peuvent être reconnus. Certains caractères spéciaux ne sont pas reconnus selon les langues.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Format de fichier pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

En utilisant un format de fichier correct lors de la reconnaissance optique de caractères, le résultat obtenu peut être plus précis.
Si le résultat n'est pas correct, vérifier que le format de fichier de l'original lu est adapté à la reconnaissance optique des caractères.
IMPORTANT
Si les originaux contiennent une partie importante de texte sur chaque page, la reconnaissance optique des caractères risque de ne pas s'exécuter correctement.
Rubrique
Détails
Format de l'original
Documents imprimés, documents comportant du texte (un document qui contient du texte, des figures, des images, des tableaux et aucun caractère incliné)
Format du texte
Ecritures horizontale et verticale
Documents rédigés dans une écriture horizontale et aussi une écriture verticale peuvent être reconnus.
Seule l'écriture horizontale peut être reconnue pour les langues européennes et le coréen.
Document sans colonne complexe
Taille de caractère
8 à 40 points
0A3A-0JA