Scanning with the OCR Function

Acest mod permite realizarea OCR (optical character recognition/recunoaşterea optică a caracterelor) pentru extragerea datelor care pot fi recunoscute ca text din imaginea scanată şi crearea unui fişier PDF/XPS/OOXML (pptx/docx) care este adresabil (se poate căuta). De asemenea, puteţi seta <Compact> dacă selectaţi ca format de fişier PDF sau XPS.

Pentru informaţii despre produsele opţionale necesare pentru utilizarea acestei funcţii şi despre formatele de fişiere, consultaţi Opţiuni de sistem.

Scanarea cu OCR

Rezultatele OCR nu sunt satisfăcătoare

Scanarea cu OCR

Aşezaţi documentul original. Aşezarea originalelor

Apăsaţi <Scanare şi Transmitere>. Ecranul <Acasă>

Specificaţi destinaţia pe ecranul Caracteristici de bază pentru scanare. Ecranul Caracteristici de bază pentru scanare

Specificaţi setările de scanare după caz. Operaţiuni de bază pentru scanarea documentelor originale

Selectaţi un format de fişier.

Dacă doriţi să separaţi imaginile multiple şi să le transmiteţi ca fişiere separate, fiecare constând în numai câte o pagină, apăsaţi <Divizare pe pagini>

introduceţi numărul de pagini de împărţit la

apăsaţi <OK>. Dacă doriţi să scanaţi imaginile sub forma unui singur fişier, apăsaţi <Divizare pe pagini>

<Anulare setări>.

Pentru a selecta PDF

1	Selectaţi <PDF> , apăsaţi <Setare detalii> <OCR (Căutare Text)>.
2	Selectaţi limba de utilizat pentru OCR apăsaţi <OK>.

Pentru a selecta XPS

1	Selectaţi <XPS> , apăsaţi <Setare detalii> <OCR (Posib.căutare text)>.
2	Selectaţi o limbă de utilizat pentru OCR apăsaţi <OK>.

Pentru a selecta formatul Word pentru OOXML

1	Selectaţi <OOXML> selectaţi <Word> din lista verticală. Pentru a schimba o limbă de utilizat pentru OCR, apăsaţi <Setare detalii> <Modificare> selectaţi o limbă sau un grup de limbi apăsaţi <OK>. Selectaţi o limbă sau un grup de limbi în funcţie de limba utilizată în documentele scanate.

Pentru a selecta formatul PowerPoint pentru OOXML

1	Selectaţi <OOXML> selectaţi <PowerPoint> din lista verticală. apăsaţi <Setare detalii> <OCR (Căutare Text)>.
2	Selectaţi o limbă de utilizat pentru OCR apăsaţi <OK>.

Apăsaţi <OK>.


Dacă selectaţi <PDF; OCR>, <XPS; OCR>, sau <OOXML; OCR> ca format de fişier şi opţiunea <Scanare inteligentă> este setată la <Pornit> în <OCR (Text Searchable) Settings>/<OCR (Prioritize Speed)>, orientarea originalului este detectată şi documentul este rotit automat, după caz, înainte să fie trimis. <Setări OCR (Posib. căutare text)> Dacă selectaţi <PDF> sau <XPS> ca format de fişier, puteţi seta <Compact> şi <OCR (Posib.căutare text)> simultan. În acest caz, <PDF; Compact> sau <XPS; Compact> se afişează ca format de fişier pe ecranul Caracteristici de bază pentru scanare şi transmitere. Dacă selectaţi <Word> pentru <OOXML>, puteţi să setaţi ştergerea imaginilor de fundal scanate. Puteţi genera fişiere Word uşor de editat, fără imagini nedorite. <Includeţi imaginile de fundal în Fişierul Word>

Dacă selectaţi <PDF; OCR>, <XPS; OCR>, sau <OOXML; OCR> ca format de fişier şi opţiunea <Scanare inteligentă> este setată la <Pornit> în <OCR (Text Searchable) Settings>/<OCR (Prioritize Speed)>, orientarea originalului este detectată şi documentul este rotit automat, după caz, înainte să fie trimis. <Setări OCR (Posib. căutare text)>

Dacă selectaţi <PDF> sau <XPS> ca format de fişier, puteţi seta <Compact> şi <OCR (Posib.căutare text)> simultan. În acest caz, <PDF; Compact> sau <XPS; Compact> se afişează ca format de fişier pe ecranul Caracteristici de bază pentru scanare şi transmitere.

Dacă selectaţi <Word> pentru <OOXML>, puteţi să setaţi ştergerea imaginilor de fundal scanate. Puteţi genera fişiere Word uşor de editat, fără imagini nedorite. <Includeţi imaginile de fundal în Fişierul Word>

Rezultatele OCR nu sunt satisfăcătoare

Când creaţi fişiere PDF/XPS/OOXML care pot fi căutate în text, este posibil ca OCR (Optical Character Recognition - Recunoaşterea optică a caracterelor) să nu fie procesată corect. Acest lucru se poate întâmpla deoarece setările de pe aparat sau limba, tipul de caractere sau formatul documentului original nu sunt adecvate pentru procesarea OCR.

Verificarea setărilor aparatului şi a limbilor acceptate

Puteţi îmbunătăţi procesarea OCR prin personalizarea setărilor aparatului în ceea ce priveşte recunoaşterea caracterelor în funcţie de originale sau prin utilizarea tipurilor sau fonturilor de caractere adecvate în originale, astfel încât aparatul să poată recunoaşte caracterele.

Setări şi limbi pentru procesarea OCR

Element	Detalii
Setări de limbă pentru recunoaşterea caracterelor	Când o limbă este specificată cu OCR selectată în <Format fişier>: Caracterele sun recunoscute pe baza limbii pe care o selectaţi pentru fiecare format de fişier. Când o limbă nu este specificată cu OCR selectată în <Format fişier>: Caracterele sun recunoscute pe baza limbii pe care o selectaţi în <Comutare limbă/tastatură> (<Comutare limbă/tastatură>).*1
Limbi asiatice recunoscute	Japoneză, chineză (simplificată), chineză (tradiţională), coreeană Tipuri şi fonturi de caractere recunoscute (limbi asiatice)
Limbi şi grupuri de limbi europene recunoscute	Limbi: Engleză, franceză, italiană, germană, spaniolă, olandeză, portugheză, albaneză, catalană, daneză, finlandeză, islandeză, norvegiană, suedeză, croată, cehă, maghiară, poloneză, slovacă, estonă, letonă, lituaniană, rusă, greacă, turcă Grupuri de limbi: Vest-europene (ISO)2, Central-europene (ISO)3, Baltice (ISO)*4 Tipuri şi fonturi de caractere recunoscute (limbi europene)

*1 Afişarea limbilor în listă poate varia. Dacă selectaţi engleză, franceză, italiană, germană, spaniolă, thai sau vietnameză, limba selectată este recunoscută ca Vest-europeană (ISO).

*2 Inclusiv engleză, franceză, italiană, germană, spaniolă, olandeză, portugheză, albaneză, catalană, daneză, finlandeză, islandeză, norvegiană, suedeză.

*3 Inclusiv croată, cehă, maghiară, poloneză şi slovacă.

*4 Inclusiv estonă, letonă şi lituaniană.

Tipuri şi fonturi de caractere recunoscute (limbi asiatice)

Element	Detalii
Tipuri de caractere recunoscute	Japoneză: Caractere alfanumerice, caractere Kana, caractere Kanji (JIS primul nivel, parţial JIS al doilea nivel), simboluri Chineză (simplificată): Caractere alfanumerice, caractere chineze, simboluri (GB2312-80) Chineză (tradiţională): Caractere alfanumerice, caractere chineze, simboluri (Big5) Coreeană: Caractere alfanumerice, caractere chineze, caractere Hangul, simboluri (KSC5601)
Fonturi recunoscute	Sunt acceptate mai multe fonturi. (Se recomandă tipul Ming-cho.) Caracterele italice nu pot fi recunoscute.
Fonturi utilizate pentru caractere convertite (Numai când pentru formatul de fişier este selectat Word)	Japoneză: Caractere asiatice: MS Mincho Caractere europene: Centru Chineză (simplificată): Caractere asiatice: SimSun Caractere europene: Calibri Chineză (tradiţională): Caractere asiatice: PMingLiU Caractere europene: Calibri

Tipuri şi fonturi de caractere recunoscute (limbi europene)

Element	Detalii
Tipuri de caractere recunoscute	Caractere alfanumerice, caractere speciale ale limbilor recunoscute*, simboluri
Fonturi recunoscute	Sunt acceptate mai multe fonturi. (Se recomandă Times, Century şi Arial.) Caracterele italice pot fi recunoscute.
Fonturi utilizate pentru caractere convertite (Numai când pentru formatul de fişier este selectat Word)	Calibri Stilul italic nu este reprodus.

* Următoarele caractere greceşti speciale pot fi recunoscute. De asemenea, caracterele speciale pentru fiecare limbă pot fi recunoscute. În funcţie de limbă, unele caractere speciale nu pot fi recunoscute.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Verificarea formatului documentelor originale

Utilizaţi originale adecvate procesării OCR pentru a îmbunătăţi acurateţea procesării atunci când creaţi fişiere PDF/XPS/OOXML care au posibilitatea de căutare.

Element	Detalii
Format originale	Documente imprimate, documente de procesare Word (documente constând din text, grafică, fotografii sau tabele şi fără niciun caracter înclinat)
Format text	Scrierea pe orizontală şi pe verticală (documentele care conţin atât scriere orizontală cât şi verticală pot fi recunoscute) Poate fi recunoscută doar scrierea pe orizontală pentru limbile europene şi text coreean. Documente cu de la una la trei coloane fără setări de coloane complexe
Dimensiune caracter	8 - 40 de puncte
Format tabel (numai pentru format Word)	Tabele care îndeplinesc următoarele condiţii: Tabelele constau din pătrate împărţite cu linii continue Tabele cu până la 32 de coloane Tabele cu până la 32 de rânduri


Este posibil ca unele originale potrivite pentru procesarea OCR să nu fie procesate corect. O acurateţe ridicată nu poate fi obţinută cu originale care includ o mare cantitate de text pe fiecare pagină. Caracterele pot fi înlocuite cu caractere neintenţionate sau pot lipsi din cauza culorii de fundal a originalului, a formei şi a mărimii caracterelor sau a caracterelor înclinate.* Este posibil ca paragrafele, pauzele de linie sau tabelele să nu poată fi reproduse.* Unele părţi din ilustraţii, fotografii sau impresii de sigiliu pot fi recunoscute ca fiind caractere şi înlocuite cu caractere.* * Cînd Word se selectează ca format de fişier.

Este posibil ca unele originale potrivite pentru procesarea OCR să nu fie procesate corect.

O acurateţe ridicată nu poate fi obţinută cu originale care includ o mare cantitate de text pe fiecare pagină.

Caracterele pot fi înlocuite cu caractere neintenţionate sau pot lipsi din cauza culorii de fundal a originalului, a formei şi a mărimii caracterelor sau a caracterelor înclinate.*

Este posibil ca paragrafele, pauzele de linie sau tabelele să nu poată fi reproduse.*

Unele părţi din ilustraţii, fotografii sau impresii de sigiliu pot fi recunoscute ca fiind caractere şi înlocuite cu caractere.*

* Cînd Word se selectează ca format de fişier.