Scanning with the OCR Function

Acest mod permite realizarea OCR (optical character recognition/recunoaşterea optică a caracterelor) pentru extragerea datelor care pot fi recunoscute ca text din imaginea scanată şi crearea unui fişier PDF/XPS/OOXML (pptx/docx) care este adresabil (se poate căuta). De asemenea, puteţi seta <Compact> dacă selectaţi ca format de fişier PDF sau XPS.

Scanarea cu OCR

1
Aşezaţi documentul original. Aşezarea originalelor
2
Apăsaţi <Scanare şi Transmitere>. Ecranul <Acasă>
3
Specificaţi destinaţia pe ecranul Caracteristici de bază pentru scanare. Ecranul Caracteristici de bază pentru scanare
4
Specificaţi setările de scanare după caz. Operaţiuni de bază pentru scanarea documentelor originale
5
Selectaţi un format de fişier.
Dacă doriţi să separaţi imaginile multiple şi să le transmiteţi ca fişiere separate, fiecare constând în numai câte o pagină, apăsaţi <Divizare pe pagini>  introduceţi numărul de pagini de împărţit la  apăsaţi <OK>. Dacă doriţi să scanaţi imaginile sub forma unui singur fişier, apăsaţi <Divizare pe pagini>  <Anulare setări>.
Pentru a selecta PDF
Pentru a selecta XPS
Pentru a selecta formatul Word pentru OOXML
Pentru a selecta formatul PowerPoint pentru OOXML
6
Apăsaţi <OK>.
Dacă selectaţi <PDF; OCR>, <XPS; OCR> sau <OOXML; OCR> ca format de fişier şi opţiunea <Scanare inteligentă> este setată la <Pornit> în <OCR (Text Searchable) Settings>, orientarea originalului este detectată şi documentul este rotit automat, după caz, înainte să fie trimis. <Setări OCR (Posib. căutare text)>
Dacă selectaţi <PDF> sau <XPS> ca format de fişier, puteţi seta <Compact> şi <OCR (Posib.căutare text)> simultan. În acest caz, <PDF; Compact> sau <XPS; Compact> se afişează ca format de fişier pe ecranul Caracteristici de bază pentru scanare şi transmitere.
Dacă selectaţi <Word> pentru <OOXML>, puteţi să setaţi ştergerea imaginilor de fundal scanate. Puteţi genera fişiere Word uşor de editat, fără imagini nedorite. <Includeţi imaginile de fundal în Fişierul Word>
Selectaţi o limbă sau un grup în funcţie de limba utilizată în originalele de scanat. Setări şi limbi pentru procesarea OCR

Rezultatele OCR nu sunt satisfăcătoare

Când creaţi fişiere PDF/XPS/OOXML care pot fi căutate în text, este posibil ca OCR (Optical Character Recognition - Recunoaşterea optică a caracterelor) să nu fie procesată corect. Acest lucru se poate întâmpla deoarece setările de pe aparat sau limba, tipul de caractere sau formatul documentului original nu sunt adecvate pentru procesarea OCR.

Verificarea setărilor aparatului şi a limbilor acceptate

Puteţi îmbunătăţi procesarea OCR prin personalizarea setărilor aparatului în ceea ce priveşte recunoaşterea caracterelor în funcţie de originale sau prin utilizarea tipurilor sau fonturilor de caractere adecvate în originale, astfel încât aparatul să poată recunoaşte caracterele.

Setări şi limbi pentru procesarea OCR

Element
Detalii
Setări de limbă pentru recunoaşterea caracterelor
Când o limbă este specificată cu OCR selectată în <Format fişier>:
Caracterele sun recunoscute pe baza limbii pe care o selectaţi pentru fiecare format de fişier.
Când o limbă nu este specificată cu OCR selectată în <Format fişier>:
Caracterele sun recunoscute pe baza limbii pe care o selectaţi în <Comutare limbă/tastatură> (<Comutare limbă/tastatură>).*1
Limbi asiatice recunoscute
Japoneză, chineză (simplificată), chineză (tradiţională), coreeană
Tipuri şi fonturi de caractere recunoscute (limbi asiatice)
Limbi şi grupuri de limbi europene recunoscute
Limbi:
Engleză, franceză, italiană, germană, spaniolă, olandeză, portugheză, albaneză, catalană, daneză, finlandeză, islandeză, norvegiană, suedeză, croată, cehă, maghiară, poloneză, slovacă, estonă, letonă, lituaniană, rusă, greacă, turcă
Grupuri de limbi:
Vest-europene (ISO)*2, Central-europene (ISO)*3, Baltice (ISO)*4
Tipuri şi fonturi de caractere recunoscute (limbi europene)
*1 Afişarea limbilor în listă poate varia. Dacă selectaţi engleză, franceză, italiană, germană, spaniolă, thai sau vietnameză, limba selectată este recunoscută ca Vest-europeană (ISO).
*2 Inclusiv engleză, franceză, italiană, germană, spaniolă, olandeză, portugheză, albaneză, catalană, daneză, finlandeză, islandeză, norvegiană, suedeză.
*3 Inclusiv croată, cehă, maghiară, poloneză şi slovacă.
*4 Inclusiv estonă, letonă şi lituaniană.

Tipuri şi fonturi de caractere recunoscute (limbi asiatice)

Element
Detalii
Tipuri de caractere recunoscute
Japoneză:
Caractere alfanumerice, caractere Kana, caractere Kanji (JIS primul nivel, parţial JIS al doilea nivel), simboluri
Chineză (simplificată):
Caractere alfanumerice, caractere chineze, simboluri (GB2312-80)
Chineză (tradiţională):
Caractere alfanumerice, caractere chineze, simboluri (Big5)
Coreeană:
Caractere alfanumerice, caractere chineze, caractere Hangul, simboluri (KSC5601)
Fonturi recunoscute
Sunt acceptate mai multe fonturi. (Se recomandă tipul Ming-cho.)
Caracterele italice nu pot fi recunoscute.
Fonturi utilizate pentru caractere convertite (Numai când pentru formatul de fişier este selectat Word)
Japoneză:
Caractere asiatice: MS Mincho
Caractere europene: Centru
Chineză (simplificată):
Caractere asiatice: SimSun
Caractere europene: Calibri
Chineză (tradiţională):
Caractere asiatice: PMingLiU
Caractere europene: Calibri

Tipuri şi fonturi de caractere recunoscute (limbi europene)

Element
Detalii
Tipuri de caractere recunoscute
Caractere alfanumerice, caractere speciale ale limbilor recunoscute*, simboluri
Fonturi recunoscute
Sunt acceptate mai multe fonturi. (Se recomandă Times, Century şi Arial.)
Caracterele italice pot fi recunoscute.
Fonturi utilizate pentru caractere convertite (Numai când pentru formatul de fişier este selectat Word)
Calibri
Stilul italic nu este reprodus.
* Următoarele caractere greceşti speciale pot fi recunoscute. De asemenea, caracterele speciale pentru fiecare limbă pot fi recunoscute. În funcţie de limbă, unele caractere speciale nu pot fi recunoscute.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Verificarea formatului documentelor originale

Utilizaţi originale adecvate procesării OCR pentru a îmbunătăţi acurateţea procesării atunci când creaţi fişiere PDF/XPS/OOXML care au posibilitatea de căutare.
Element
Detalii
Format originale
Documente imprimate, documente de procesare Word (documente constând din text, grafică, fotografii sau tabele şi fără niciun caracter înclinat)
Format text
Scrierea pe orizontală şi pe verticală (documentele care conţin atât scriere orizontală cât şi verticală pot fi recunoscute)
Poate fi recunoscută doar scrierea pe orizontală pentru limbile europene şi text coreean.
Documente cu de la una la trei coloane fără setări de coloane complexe
Dimensiune caracter
8 - 40 de puncte
Format tabel (numai pentru format Word)
Tabele care îndeplinesc următoarele condiţii:
Tabelele constau din pătrate împărţite cu linii continue
Tabele cu până la 32 de coloane
Tabele cu până la 32 de rânduri
Este posibil ca unele originale potrivite pentru procesarea OCR să nu fie procesate corect.
O acurateţe ridicată nu poate fi obţinută cu originale care includ o mare cantitate de text pe fiecare pagină.
Caracterele pot fi înlocuite cu caractere neintenţionate sau pot lipsi din cauza culorii de fundal a originalului, a formei şi a mărimii caracterelor sau a caracterelor înclinate.*
Este posibil ca paragrafele, pauzele de linie sau tabelele să nu poată fi reproduse.*
Unele părţi din ilustraţii, fotografii sau impresii de sigiliu pot fi recunoscute ca fiind caractere şi înlocuite cu caractere.*
* Cînd Word se selectează ca format de fişier.
7SAC-071