Scansione con la funzione OCR

Questa modalità consente di eseguire il riconoscimento OCR (Optical Character Recognition) per estrarre da un'immagine acquisita i dati che possono essere riconosciuti come testo e creare un file PDF/XPS/OOXML (pptx/docx) che sia cercabile. È anche possibile impostare <Compresso> se si seleziona PDF o XPS come formato di file.

Scansione con OCR

1
Posizionare l'originale. Posizionamento dei documenti
2
Premere <Scansione e invio>. Schermata <Home>
3
Specificare la destinazione nella schermata Scan Basic Features. Schermata delle funzioni di base per la scansione
4
Specificare le impostazioni di scansione in base alle esigenze. Operazioni base per la scansione degli originali
5
Selezionare un formato di file.
Per separare più immagini e inviarle come file separati, ognuno dei quali è costituito da un'unica pagina, premere <Suddivisione in più pagine>  immettere il numero di pagine per le quali suddividere le immagini  premere <OK>. Per eseguire la scansione delle immagini come singolo file, premere <Suddivisione in più pagine>  <Annulla impostaz.>.
Per selezionare PDF
Per selezionare XPS
Per selezionare il formato Word per OOXML
Per selezionare il formato PowerPoint per OOXML
6
Premere <OK>.
Gli originali lunghi (432 mm o più lunghi) non possono essere usati con <OCR (Testo ricercabile)>.
Se si seleziona <PDF (OCR)>, <XPS (OCR)> o <OOXML (OCR)> come formato di file e <Riconoscimento automatico> è impostato su <On> in <Impostazioni OCR (Testo ricercabile)>/<OCR (Priorità velocità)>, viene rilevato l'orientamento dell'originale e il documento viene ruotato automaticamente, se necessario, prima dell'invio. <Impostazioni OCR (Testo ricercabile)>
Se si seleziona <OCR (Testo ricercabile)>, si può inviare solo con un rapporto di zoom di <1:1> o <Autom.>.
Se si seleziona <PDF> o <XPS> come formato di file, si possono impostare <Compresso> e <OCR (Testo ricercabile)> contemporaneamente. In questo caso, <PDF (Compresso)> o <XPS(Compresso)> appare come formato di viene rilevato sulla schermata delle funzioni di base di scansione e invio.
Se si seleziona <Word> per <OOXML>, è possibile scegliere di eliminare le immagini di sfondo acquisite tramite scanner. Si possono generare file di Word facili da modificare senza immagini indesiderate. <Includere immagini sfondo in file Word>
Se è in uso la funzione <Scansione e memorizzazione>, la lingua OCR può essere specificata solo quando si seleziona <Word> per <OOXML> o si seleziona <OCR (Priorità precisione)> per <PDF>.

Risultati OCR non soddisfacenti

Quando si creano file PDF/XPS/OOXML con testo ricercabile, è possibile che l'elaborazione OCR (Optical Character Recognition) non avvenga correttamente perché le impostazioni della macchina, la lingua, il tipo di carattere o il formato del documento originale non sono appropriati per l'elaborazione OCR.

Verifica delle impostazioni della macchina e lingue supportate

È possibile migliorare l'elaborazione OCR personalizzando le impostazioni della macchina in relazione al riconoscimento dei caratteri secondo gli originali, oppure usando tipi di caratteri o font idonei negli originali, di modo che la macchina possa riconoscere i caratteri.

Impostazioni e lingue per l'elaborazione OCR

Voce
Dettagli
Impostazioni della lingua per il riconoscimento dei caratteri
Quando è specificata una lingua con OCR selezionato in <Formato file>:
I caratteri vengono riconosciuti in base alla lingua selezionata per ogni formato di file.
Quando non è specificata una lingua con OCR selezionato in <Formato file>:
I caratteri vengono riconosciuti in base alla lingua selezionata in <Variazione lingua/tastiera> (<Variazione lingua/tastiera>).*1
Lingue asiatiche riconoscibili*2
Giapponese, cinese (semplificato), cinese (tradizionale), coreano
Tipi di caratteri e font riconoscibili (lingue asiatiche)
Lingue e gruppi linguistici europei riconoscibili
Lingue:
inglese, francese, italiano, tedesco, spagnolo, olandese, portoghese, albanese, catalano, danese, finlandese, islandese, norvegese, svedese, croato, ceco, ungherese, polacco, slovacco, estone, lettone, lituano, russo, greco, turco, sloveno*3, rumeno*3, bulgaro*3, ebraico*3
Gruppi linguistici:
Europa occidentale (ISO)*4, Europa centrale (ISO)*5, Baltico (ISO)*6
Tipi di caratteri e font riconoscibili (lingue europee)
*1 Le lingue visualizzate nell'elenco possono variare. Se si seleziona inglese, francese, italiano, tedesco, spagnolo, tailandese o vietnamita, la lingua selezionata viene riconosciuta come Europa occidentale (ISO).
*2 Le lingue asiatiche non possono essere rilevate quando è selezionato <OCR (Priorità precisione)>.
*3 Questa può essere selezionato solo con <OCR (Priorità precisione)>.
*4 Compresi inglese, francese, italiano, tedesco, spagnolo, olandese, portoghese, albanese, catalano, danese, finlandese, islandese, norvegese e svedese.
*5 Compresi croato, ceco, ungherese, polacco e slovacco.
*6 Compresi estone, lettone e lituano.

Tipi di caratteri e font riconoscibili (lingue asiatiche)

Voce
Dettagli
Tipi di caratteri riconoscibili
Giapponese:
Caratteri alfanumerici, caratteri Kana, caratteri Kanji (primo livello JIS, nonché alcuni del secondo livello JIS), simboli
Cinese (semplificato):
Caratteri alfanumerici, caratteri cinesi, simboli (GB2312-80)
Cinese (tradizionale):
Caratteri alfanumerici, caratteri cinesi, simboli (Big5)
Coreano:
Caratteri alfanumerici, caratteri cinesi, caratteri Hangul, simboli (KSC5601)
Font riconoscibili
Sono supportati più font (si consiglia il tipo Ming-cho).
I caratteri in corsivo non possono essere riconosciuti.
Font usati per caratteri convertiti (solo quando viene selezionato Word come formato file)
Giapponese:
Caratteri asiatici: MS Mincho
Caratteri europei: Century
Cinese (semplificato):
Caratteri asiatici: SimSun
Caratteri europei: Calibri
Cinese (tradizionale):
Caratteri asiatici: PMingLiU
Caratteri europei: Calibri

Tipi di caratteri e font riconoscibili (lingue europee)

Voce
Dettagli
Tipi di caratteri riconoscibili
Caratteri alfanumerici, caratteri speciali della lingua riconosciuta*1, simboli
Font riconoscibili
Sono supportati più font (si consigliano Times, Century e Arial).*2
I caratteri in corsivo possono essere riconosciuti.
Font usati per caratteri convertiti (solo quando viene selezionato Word come formato file)
Calibri
Stile corsivo non riprodotto.
*1 Possono essere riconosciuti i seguenti caratteri speciali greci. Possono essere riconosciuti anche i caratteri speciali per ogni lingua. Alcuni caratteri speciali non possono essere riconosciuti a seconda della lingua.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω
*2 Quando è selezionato <OCR (Priorità precisione)>, vengono riconosciuti i font di tipo Arial, Times New Roman e Courier New.

Verifica del formato dei documenti originali

Usare gli originali idonei per l'elaborazione OCR per migliorare la precisione dell'elaborazione durante la creazione di file cercabili PDF/XPS/OOXML.
Voce
Dettagli
Formato originale
Documenti stampati, documenti di programmi di videoscrittura (documenti che consistono in testo, grafica, fotografie o tabelle, senza inclinazione dei caratteri)
Formato del testo
Scrittura in orizzontale e verticale (possono essere riconosciuti anche documenti contenenti scrittura sia in orizzontale che in verticale)
Può essere riconosciuta solo la scrittura in orizzontale per il testo in lingue europee e in coreano.
Documento da una a tre colonne senza impostazioni di colonna complesse
Dimensioni dei caratteri
da 8 a 40 punti
Formato delle tabelle (solo per formato Word)
Tabelle che soddisfano le seguenti condizioni:
Tabelle che consistono in riquadri divisi da linee continue
Tabelle di 32 colonne al massimo
Tabelle di 32 righe al massimo
È possibile che alcuni originali idonei per l'elaborazione OCR non siano elaborati correttamente.
È possibile che non si raggiunga una precisione elevata con originali che comprendono una grande quantità di testo su ogni pagina.
I caratteri possono essere sostituiti da caratteri non desiderati o essere mancanti a causa del colore di sfondo dell'originale, della forma e delle dimensioni dei caratteri o dell'inclinazione dei caratteri.*
È possibile che capoversi, interruzioni di linea o tabelle non siano riprodotti.*
È possibile che alcune parti di illustrazioni, fotografie o timbri non siano riconosciuti come caratteri e che siano sostituite da caratteri.*
* Quando viene selezionato Word come formato del file.
85J1-0C3