Se OCR (Testo ricercabile) non funziona in modo appropriato

In questa sezione viene spiegato come la funzione OCR (Testo ricercabile) opera durante la creazione di file ricercabili PDF/XPS/OOXML e vengono date informazioni sul formato file idoneo per la funzione OCR (Test ricercabili).
Consultare le seguenti istruzioni se non è possibile ottenere il risultato idoneo di OCR (riconoscimento del carattere ottico).

OCR (Testo ricercabile) Funzione per creare file ricercabili PDF/XPS/OOXML

Quando si creano file ricercabili PDF/XPS/OOXML, le prestazioni di OCR possono variare in base al formato file selezionato. Consultare la seguente tabella per ulteriori informazioni.
IMPORTANTE
Anche se si esegue l'OCR in base alla lingua utilizzata negli originali, potrebbe non essere possibile ottenere il risultato corretto in base al testo e al formato di file degli originali.
Voce
Formato di file
PDF/XPS/PowerPoint
Word
Riconoscimento lingua
I caratteri vengono riconosciuti come una delle seguenti lingue o gruppi di lingue in base alla lingua selezionata in [Variazione lingua/tastiera] in [Preferenze] (Impostazioni/Registrazioni)*1 *2
Premere [Cambia] per selezionare una lingua usata negli originali dalle seguenti lingue o gruppi di lingue. Il carattere viene riconosciuto in base alla lingua selezionata.
Lingue asiatiche
Viene riconosciuto il testo nelle seguenti lingue:
giapponese, cinese (semplificato), cinese (tradizionale), coreano
Lingue europee
Viene riconosciuto il testo nelle seguenti lingue o gruppi di lingue
Lingue
inglese, francese, italiano, tedesco, spagnolo, olandese, portoghese, albanese, catalano, danese, finlandese, islandese, norvegese, svedese, croato, ceco, ungherese, polacco, slovacco, estone, lettone, lituano, russo, greco, turco
Gruppi di lingue
Europa occidentale (ISO), Europa centrale (ISO), Baltico (ISO) *3
Riconoscimento carattere per le lingue asiatiche
Tipo di carattere di riconoscimento
Giapponese: caratteri alfanumerici, caratteri Kana, caratteri Kanji (primo livello JIS, secondo livello JIS (parzialmente)), simboli
Cinese (semplificato): caratteri alfanumerici, caratteri cinesi, simboli (GB2312-80)
Cinese (tradizionale): caratteri alfanumerici, caratteri cinesi, simboli (Big5)
Coreano: caratteri alfanumerici, caratteri Kanji, caratteri Korean Hangul, simboli (KSC5601)
Font di riconoscimento
Sono supportati più font (consigliato il tipo Ming-cho)
Il tipo corsivo non può essere riconosciuto
Font convertito
-
Quando viene selezionato giapponese:
Testo asiatico: MS Mincho
Testo europeo: Century
Quando viene selezionato cinese (semplificato):
Testo asiatico: SimSun
Testo europeo: Calibri
Quando viene selezionato cinese (tradizionale):
Testo asiatico: PMingLiU
Testo europeo: Calibri
Riconoscimento carattere per le lingue europee
Tipo di carattere di riconoscimento
Caratteri alfanumerici, caratteri speciali della lingua riconosciuta*4, simboli
Font di riconoscimento
Supportati più font (consigliati Times, Century e Arial)
Il tipo corsivo può essere riconosciuto
Carattere convertito
-
Visualizzato in Calibri
Il tipo corsivo non può essere convertito
*1 La lingua visualizzata nell'elenco delle lingue in [Variazione lingua/tastiera] in [Preferenze] (Impostazioni/Registrazione) può variare.
*2 Se si seleziona inglese, francese, italiano, tedesco, spagnolo, tailandese o vietnamita in [Variazione lingua/tastiera] in [Preferenze] (Impostazioni/Registrazione), la lingua verrà riconosciuta come Europa occidentale (ISO).
*3 Ciascun gruppo di lingue consiste delle seguenti lingue. Se si seleziona un gruppo di lingue, verrà riconosciuto il testo scritto nelle lingue del relativo gruppo di lingue.
Europa occidentale (ISO):
inglese, francese, italiano, tedesco, spagnolo, olandese, portoghese, albanese, catalano, danese, finlandese, islandese, norvegese, svedese
Europa centrale (ISO):
croato, ceco, ungherese, polacco, slovacco
Baltico (ISO):
estone, lettone, lituano
*4 Se si seleziona greco, saranno riconosciuti i seguenti caratteri speciali. Se si selezionano altre lingue, potranno essere riconosciuti i caratteri speciali per ciascuna lingua. Alcuni caratteri speciali non potranno essere riconosciuti in base alla lingua.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Formato file per la creazione di file ricercabili PDF/XPS/OOXML

Usando il formato file corretto per OCR è possibile migliorare l'accuratezza del risultato OCR.
Se non è possibile ottenere un risultato OCR corretto, confermare che il formato file dell'originale acquisito è appropriato per l'OCR.
IMPORTANTE
Se si utilizzano originali contenenti molto testo per pagina, l'OCR potrebbe non funzionare correttamente.
Quando si seleziona un formato Word, l'OCR potrebbe non funzionare correttamente anche se si usano originali nel formato file raccomandato.
In base al colore dello sfondo, lo stile, la dimensione e l'inclinazione del carattere, alcuni caratteri potrebbero essere sostituiti in modo errato o potrebbero essere assenti nel risultato generato dall'OCR.
Paragrafi, interruzioni e tavole dell'originale potrebbero non essere riconosciuti.
Una parte di un'immagine, come ad esempio la grafica, le foto o i timbri, potrebbe essere riconosciuta e sostituita con del testo.
Voce
Dettagli
Formato dell'originale
Documenti stampati, documenti di testo (un documento che consiste di testo, figure, immagini, tabelle e non inclinazione caratteri)
Formato del testo
Scrittura orizzontale, scrittura verticale
Possono essere riconosciuti documenti contenenti scritture orizzontali e verticali.
Per le lingue europee e per il coreano possono essere riconosciute solo scritture orizzontali.
Documento senza colonne complesse
Dimensione caratteri
da 8 a 40 punti
Formato della tabella
(solo per documenti Word)
Le tabelle conformi alle seguenti condizioni
Tabelle a riquadri con linee continue
Il numero di righe è 32 o inferiore
Il numero di colonne è 32 o inferiore
4630-0UW