Scanarea cu funcția OCR

Acest mod permite realizarea OCR (optical character recognition/recunoașterea optică a caracterelor) pentru extragerea datelor care pot fi recunoscute ca text din imaginea scanată și crearea unui fișier PDF/XPS/OOXML (pptx/docx) care este adresabil (se poate căuta). De asemenea, puteți seta <Compact> dacă selectați ca format de fișier PDF sau XPS.

Scanarea cu OCR

1
Așezați documentul original. Așezarea originalelor
2
Apăsați <Scanare şi Transmitere>. Ecranul <Acasă>
3
Specificați destinația pe ecranul Caracteristici de bază pentru scanare. Ecranul Caracteristici de bază pentru scanare
4
Specificați setările de scanare după caz. Operațiuni de bază pentru scanarea documentelor originale
5
Selectați un format de fișier.
Dacă doriți să separați imaginile multiple și să le transmiteți ca fișiere separate, fiecare constând în numai câte o pagină, apăsați <Divizare pe pagini>  introduceți numărul de pagini de împărțit la  apăsați <OK>. Dacă doriți să scanați imaginile sub forma unui singur fișier, apăsați <Divizare pe pagini>  <Anulare setări>.
Pentru a selecta PDF
Pentru a selecta XPS
Pentru a selecta formatul Word pentru OOXML
Pentru a selecta formatul PowerPoint pentru OOXML
6
Apăsați <OK>.
Dacă selectați <PDF; OCR>, <XPS; OCR> sau <OOXML; OCR> ca format de fișier și opțiunea <Scanare inteligentă> este setată la <Pornit> în <OCR (Text Searchable) Settings>, orientarea originalului este detectată și documentul este rotit automat, după caz, înainte să fie trimis. <Setări OCR (Posib. căutare text)>
Dacă selectați <PDF> sau <XPS> ca format de fișier, puteți seta <Compact> și <OCR (Posib.căutare text)> simultan. În acest caz, <PDF; Compact> sau <XPS; Compact> se afișează ca format de fișier pe ecranul Caracteristici de bază pentru scanare și transmitere.
Dacă selectați <Word> pentru <OOXML>, puteți să setați ștergerea imaginilor de fundal scanate. Puteți genera fișiere Word ușor de editat, fără imagini nedorite. <Includeţi imaginile de fundal în Fişierul Word>
Selectați o limbă sau un grup în funcție de limba utilizată în originalele de scanat. Setări și limbi pentru procesarea OCR

Rezultatele OCR nu sunt satisfăcătoare

Când creați fișiere PDF/XPS/OOXML care pot fi căutate în text, este posibil ca OCR (Optical Character Recognition - Recunoașterea optică a caracterelor) să nu fie procesată corect. Acest lucru se poate întâmpla deoarece setările de pe aparat sau limba, tipul de caractere sau formatul documentului original nu sunt adecvate pentru procesarea OCR.

Verificarea setărilor aparatului și a limbilor acceptate

Puteți îmbunătăți procesarea OCR prin personalizarea setărilor aparatului în ceea ce privește recunoașterea caracterelor în funcție de originale sau prin utilizarea tipurilor sau fonturilor de caractere adecvate în originale, astfel încât aparatul să poată recunoaște caracterele.

Setări și limbi pentru procesarea OCR

Element
Detalii
Setări de limbă pentru recunoașterea caracterelor
Când o limbă este specificată cu OCR selectată în <Format fişier>:
Caracterele sun recunoscute pe baza limbii pe care o selectați pentru fiecare format de fișier.
Când o limbă nu este specificată cu OCR selectată în <Format fişier>:
Caracterele sun recunoscute pe baza limbii pe care o selectați în <Comutare limbă/tastatură> (<Comutare limbă/tastatură>).*1
Limbi asiatice recunoscute
Japoneză, chineză (simplificată), chineză (tradițională), coreeană
Tipuri și fonturi de caractere recunoscute (limbi asiatice)
Limbi și grupuri de limbi europene recunoscute
Limbi:
Engleză, franceză, italiană, germană, spaniolă, olandeză, portugheză, albaneză, catalană, daneză, finlandeză, islandeză, norvegiană, suedeză, croată, cehă, maghiară, poloneză, slovacă, estonă, letonă, lituaniană, rusă, greacă, turcă
Grupuri de limbi:
Vest-europene (ISO)*2, Central-europene (ISO)*3, Baltice (ISO)*4
Tipuri și fonturi de caractere recunoscute (limbi europene)
*1 Afișarea limbilor în listă poate varia. Dacă selectați engleză, franceză, italiană, germană, spaniolă, thai sau vietnameză, limba selectată este recunoscută ca Vest-europeană (ISO).
*2 Inclusiv engleză, franceză, italiană, germană, spaniolă, olandeză, portugheză, albaneză, catalană, daneză, finlandeză, islandeză, norvegiană, suedeză.
*3 Inclusiv croată, cehă, maghiară, poloneză și slovacă.
*4 Inclusiv estonă, letonă și lituaniană.

Tipuri și fonturi de caractere recunoscute (limbi asiatice)

Element
Detalii
Tipuri de caractere recunoscute
Japoneză:
Caractere alfanumerice, caractere Kana, caractere Kanji (JIS primul nivel, parțial JIS al doilea nivel), simboluri
Chineză (simplificată):
Caractere alfanumerice, caractere chineze, simboluri (GB2312-80)
Chineză (tradițională):
Caractere alfanumerice, caractere chineze, simboluri (Big5)
Coreeană:
Caractere alfanumerice, caractere chineze, caractere Hangul, simboluri (KSC5601)
Fonturi recunoscute
Sunt acceptate mai multe fonturi. (Se recomandă tipul Ming-cho.)
Caracterele italice nu pot fi recunoscute.
Fonturi utilizate pentru caractere convertite (Numai când pentru formatul de fișier este selectat Word)
Japoneză:
Caractere asiatice: MS Mincho
Caractere europene: Centru
Chineză (simplificată):
Caractere asiatice: SimSun
Caractere europene: Calibri
Chineză (tradițională):
Caractere asiatice: PMingLiU
Caractere europene: Calibri

Tipuri și fonturi de caractere recunoscute (limbi europene)

Element
Detalii
Tipuri de caractere recunoscute
Caractere alfanumerice, caractere speciale ale limbilor recunoscute*, simboluri
Fonturi recunoscute
Sunt acceptate mai multe fonturi. (Se recomandă Times, Century și Arial.)
Caracterele italice pot fi recunoscute.
Fonturi utilizate pentru caractere convertite (Numai când pentru formatul de fișier este selectat Word)
Calibri
Stilul italic nu este reprodus.
* Următoarele caractere grecești speciale pot fi recunoscute. De asemenea, caracterele speciale pentru fiecare limbă pot fi recunoscute. În funcție de limbă, unele caractere speciale nu pot fi recunoscute.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Verificarea formatului documentelor originale

Utilizați originale adecvate procesării OCR pentru a îmbunătăți acuratețea procesării atunci când creați fișiere PDF/XPS/OOXML care au posibilitatea de căutare.
Element
Detalii
Format originale
Documente imprimate, documente de procesare Word (documente constând din text, grafică, fotografii sau tabele și fără niciun caracter înclinat)
Format text
Scrierea pe orizontală și pe verticală (documentele care conțin atât scriere orizontală cât și verticală pot fi recunoscute)
Poate fi recunoscută doar scrierea pe orizontală pentru limbile europene și text coreean.
Documente cu de la una la trei coloane fără setări de coloane complexe
Dimensiune caracter
8 - 40 de puncte
Format tabel (numai pentru format Word)
Tabele care îndeplinesc următoarele condiții:
Tabelele constau din pătrate împărțite cu linii continue
Tabele cu până la 32 de coloane
Tabele cu până la 32 de rânduri
Este posibil ca unele originale potrivite pentru procesarea OCR să nu fie procesate corect.
O acuratețe ridicată nu poate fi obținută cu originale care includ o mare cantitate de text pe fiecare pagină.
Caracterele pot fi înlocuite cu caractere neintenționate sau pot lipsi din cauza culorii de fundal a originalului, a formei și a mărimii caracterelor sau a caracterelor înclinate.*
Este posibil ca paragrafele, pauzele de linie sau tabelele să nu poată fi reproduse.*
Unele părți din ilustrații, fotografii sau impresii de sigiliu pot fi recunoscute ca fiind caractere și înlocuite cu caractere.*
* Cînd Word se selectează ca format de fișier.
A13W-08H