Si la fonction OCR (recherche de texte possible) ne s'exécute pas correctement

Cette section explique le fonctionnement de la fonction OCR (recherche de texte possible) lors de la création de fichiers PDF/XPS/OOXML permettant la recherche de texte, et le format de fichier adéquat pour la fonction OCR (recherche de texte possible).
Voir les instructions ci-dessous en cas d'incapacité d'obtenir un résultat correct lors de la reconnaissance optique des caractères (OCR).

Fonction OCR (recherche de texte possible) pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

Lors de la création de fichiers PDF/XPS/OOXML permettant la recherche de texte, les performances de la reconnaissance optique des caractères varient selon le format de fichier sélectionné. Voir le tableau ci-dessous pour plus d'informations.
IMPORTANT
Même si la reconnaissance optique des caractères est exécutée dans la même langue que celle utilisée par les originaux, le résultat risque d'être incorrect selon le texte et le format de fichier des originaux.
Elément
Format de fichier
PDF/XPS/PowerPoint
Word
Langue de la reconnaissance
Les caractères sont reconnus comme appartenant à l'une des langues ou l'un des groupes de langues suivants selon la langue sélectionnée sous [Changer langue/clavier] de [Préférences] (Réglages/Enregistrement)*1 *2
Appuyer sur [Modif.] pour sélectionner une langue utilisée dans les originaux parmi les langues ou groupes de langues proposés. Les caractères sont reconnus selon la langue sélectionnée.
Langues asiatiques
Le texte rédigé dans les langues suivantes est reconnu :
Japonais, Chinois (simplifié), Chinois (traditionnel), Coréen
Langues européennes
Le texte rédigé dans les langues ou groupes de langues suivants est reconnu :
Langues
Anglais, Français, Italien, Allemand, Espagnol, Néerlandais, Portugais, Albanais, Catalan, Danois, Danois, Finnois, Islandais, Norvégien, Suédois, Croate, Tchèque, Hongrois, Polonais, Slovaque, Estonien, Letton, Lituanien, Russe, Grec, Turc
Groupes de langues
Europe de l'Ouest (ISO), Europe centrale (ISO), Balte (ISO) *3
Reconnaissance des caractères pour les langues asiatiques
Type de caractères de la reconnaissance
Japonais : caractères alphanumériques, caractères Kana, caractères Kanji (JIS premier niveau, JIS deuxième niveau [partiellement]), symboles
Chinois (simplifié) : caractères alphanumériques, caractères chinois, symboles (GB2312-80)
Chinois (traditionnel) : caractères alphanumériques, caractères chinois, symboles (Big5)
Coréen : caractères alphanumériques, caractères Kanji, caractères Hangul coréens, symboles (KSC5601)
Polices de la reconnaissance
Multipolices prises en charge (type Ming-cho conseillé)
Les types en italiques ne sont pas reconnus
Polices converties
-
Si Japonais est sélectionné :
Texte asiatique : MS Mincho
Texte européen : Century
Si Chinois (simplifié) est sélectionné :
Texte asiatique : SimSun
Texte européen : Calibri
Si Chinois (traditionnel) est sélectionné :
Texte asiatique : PMingLiU
Texte européen : Calibri
Reconnaissance des caractères pour les langues européennes
Type de caractères de la reconnaissance
Caractères alphanumériques, caractères spéciaux de la langue reconnue*4, symboles
Polices de la reconnaissance
Multipolices prises en charge (Times, Century et Arial sont conseillées)
Les types en italiques peuvent être reconnus
Polices converties
-
Affichées en Calibli
Les types en italiques ne sont pas convertis
*1 La langue affichée sur la liste des langues sous [Changer langue/clavier] de [Préférences] (Réglages/Enregistrement) peut varier.
*2 Si Anglais, Français, Italien, Allemand, Espagnol, Thaïlandais ou Vietnamien sous [Changer langue/clavier] de [Préférences] (Réglages/Enregistrement) est sélectionné, la langue reconnue est pour Europe de l'Ouest (ISO).
*3 Chaque groupe de langues se compose des langues ci-dessous. Si un groupe est choisi, le texte rédigé dans une des langues appartenant au groupe est reconnu.
Europe de l'Ouest (ISO) :
Anglais, Français, Italien, Allemand, Espagnol, Néerlandais, Portugais, Albanais, Catalan, Danois, Danois, Finnois, Islandais, Norvégien, Suédois
Europe centrale (ISO) :
Croate, Tchèque, Hongrois, Polonais, Slovaque
Balte (ISO) :
Estonien, Letton, Lituanien
*4 Si Grec est sélectionné, les caractères spéciaux ci-dessous sont reconnus. Pour les autres langues, les caractères spéciaux de chaque langue peuvent être reconnus. Certains caractères spéciaux ne sont pas reconnus selon les langues.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Format de fichier pour la création de fichiers PDF/XPS/OOXML permettant la recherche de texte

En utilisant un format de fichier correct lors de la reconnaissance optique de caractères, le résultat obtenu peut être plus précis.
Si le résultat n'est pas correct, vérifier que le format de fichier de l'original lu est adapté à la reconnaissance optique des caractères.
IMPORTANT
Si les originaux contiennent une partie importante de texte sur chaque page, la reconnaissance optique des caractères risque de ne pas s'exécuter correctement.
Si le format Word est sélectionné, la reconnaissance optique des caractères risque de ne pas s'exécuter correctement dans le format de fichier recommandé.
Selon la couleur de fond, ou le style, la taille et l'inclinaison des caractères, certains caractères peuvent être erronés ou manquants dans le résultat de la reconnaissance optique des caractères.
Certains paragraphes, sauts et tableaux de l'original peuvent ne pas être reconnus.
Une partie d'une image, telle que des graphiques, photos ou cachets, peut être identifiée et remplacée par du texte.
Elément
Détails
Format de l'original
Documents imprimés, documents comportant du texte (un document qui contient du texte, des figures, des images, des tableaux et aucun caractère incliné)
Format du texte
Ecritures horizontale et verticale
Documents rédigés dans une écriture horizontale et aussi une écriture verticale peuvent être reconnus.
Seule l'écriture horizontale peut être reconnue pour les langues européennes et le coréen.
Document sans colonne complexe
Taille de caractère
8 à 40 points
Format de tableau
(uniquement pour des documents Word)
Les tableaux doivent remplir les conditions ci-dessous
Les tableaux carrés avec des lignes en trait continu
Le nombre de rangées ne peut pas être supérieur à 32
Le nombre de colonnes ne peut pas être supérieur à 32
462Y-0UW