Il testo non viene riconosciuto correttamente tramite l'OCR

Quando si crea un file con testo ricercabile, il testo potrebbe non essere riconosciuto correttamente dall'OCR. In tal caso, accertarsi che la lingua impostata per l'OCR e quella dell'originale siano appropriate.
È possibile modificare l'impostazione della lingua in base all'originale e migliorare la precisione del riconoscimento utilizzando un originale con un tipo di carattere e un font riconoscibili dalla macchina e usando un originale idoneo all'OCR.
IMPORTANTE
Quando il riconoscimento OCR non viene eseguito correttamente nemmeno se l'originale e l'impostazione della lingua sono appropriati
Potrebbe non essere possibile migliorare la precisione del riconoscimento per gli originali che contengono molto testo in ogni pagina.
Considerare i seguenti aspetti quando si crea un file OOXML in formato Word:
Il testo può essere sostituito da caratteri indesiderati oppure potrebbero mancare dei caratteri a seconda del colore di sfondo, del font e della relativa dimensione, dell'uso del corsivo e di altri fattori.
I paragrafi, le interruzioni di linea e le tabelle non vengono riprodotti.
Alcune immagini come i diagrammi, le foto e i timbri potrebbero non essere riconosciuti come testo e sostituiti da testo.

Impostazioni e lingue standard per il riconoscimento OCR

Impostazioni delle lingue standard per il riconoscimento dei caratteri
Le lingue selezionate quando si imposta l'OCR sono la base per il riconoscimento dei caratteri. Creazione di un file con testo ricercabile (riconoscimento OCR)
Lingue asiatiche riconoscibili
Giapponese, cinese (semplificato), cinese (tradizionale), coreano
* Per i tipi di caratteri e i font, fare riferimento a quanto segue:
Lingue e gruppi linguistici europei riconoscibili
Lingue
Inglese, francese, italiano, tedesco, spagnolo, olandese, portoghese, albanese, catalano, danese, finlandese, islandese, norvegese, svedese, croato, ceco, ungherese, polacco, slovacco, estone, lettone, lituano, russo, greco, turco, sloveno*1, rumeno*1, bulgaro*1, ebraico*1
Gruppi linguistici
Europeo occidentale (ISO)*2, Europeo centrale (ISO)*3, Baltico (ISO)*4
* Per i tipi di caratteri e i font, fare riferimento a quanto segue:
*1Selezionabile solo con [OCR (Priorità precisione)].
*2Include inglese, francese, italiano, tedesco, spagnolo, olandese, portoghese, albanese, catalano, danese, finlandese, islandese, norvegese e svedese.
*3Include inglese, croato, ceco, ungherese, polacco e slovacco.
*4Include inglese, estone, lettone e lituano.

Tipi di caratteri e font riconoscibili (lingue asiatiche)

Tipi di caratteri riconoscibili
Giapponese
Alfabeto, numeri, kanji*1, simboli, hiragana e katakana
Cinese (Semplificato)
GB2312-80 (alfabeto, numeri, kanji e simboli)
Cinese (Tradizionale)
Big5 (alfabeto, numeri, kanji e simboli)
Coreano
KSC5601 (alfabeto, numeri, kanji, simboli e Hangul)
Font riconoscibili
Supporto multi-font (opzione consigliata: Mincho)
* I caratteri in corsivo non possono essere riconosciuti.
Dimensioni dei font riconoscibili
8 punti - 48 punti
Font utilizzati dopo il riconoscimento OCR*2
Giapponese
Caratteri asiatici: MS Mincho
Caratteri europei: Century
Cinese (Semplificato)
Caratteri asiatici: SimSun
Caratteri europei: Calibri
Cinese (Tradizionale)
Caratteri asiatici: PMingLiU
Caratteri europei: Calibri
Coreano
Caratteri asiatici: Malgun Gothic
Caratteri europei: Calibri
*1Tutti i kanji standard JIS 1 e alcuni kanji standard JIS 2
*2Solo quando si crea un file OOXML in formato Word

Tipi di caratteri e font riconoscibili (lingue europee)

Tipi di caratteri riconoscibili
Alfabeto, caratteri specifici della lingua del riconoscimento*1, numeri, simboli
Font riconoscibili
Supporto multi-font (opzione consigliata: Times, Century, Arial)*2
* I caratteri in corsivo possono essere riconosciuti.
Dimensioni dei font riconoscibili
6 punti - 72 punti
Font utilizzati dopo il riconoscimento OCR*3
Calibri
* Il corsivo non può essere riprodotto.
*1A seconda della lingua, alcuni caratteri specifici potrebbero non essere riconosciuti.
*2I font Arial, Times New Roman e Courier New vengono riconosciuti con [OCR (Priorità precisione)].
*3Solo quando si crea un file OOXML in formato Word

Originali idonei al riconoscimento OCR

È possibile migliorare la precisione del riconoscimento OCR utilizzando un originale idoneo all'OCR.
Formato file dell'originale
Documenti stampati e documenti realizzati con uno strumento di elaborazione di testo
Originali composti da testo, diagrammi, foto e/o tabelle e che non sono inclinati
Formato del testo
Scrittura in orizzontale e verticale (possono essere riconosciuti anche documenti contenenti scrittura sia in orizzontale che in verticale)*1
Documenti con da una a tre colonne e senza particolari complessità
Dimensione font
8 punti - 40 punti
Formato delle tabelle*2
Tabelle che soddisfano le seguenti condizioni:
Formato rettangolare con bordi costituiti da linee continue
32 colonne o meno
32 righe o meno
*1Può essere riconosciuta solo la scrittura in orizzontale per le lingue europee e il coreano.
*2Solo quando si crea un file OOXML in formato Word
AY40-086