Skeniranje s OCR funkcijom

Ovaj način rada Vam omogućava OCR (optical character recognition) za izvlačenje podataka koji mogu biti prepoznati kao tekst u skeniranoj slici i dodaje ih kao nevidljivi sloj teksta i na taj način kreira PDF/XPS/OOXML (pptx/docx) datoteku koja je pretraživa. Također možete postaviti <Kompakt> ako odaberete PDF ili XPS kao format datoteke.

Skeniranje s OCR-om

1
Postavite izvornik. Smještanje izvornika
2
Pritisnite <Skeniranje i slanje>. Zaslon <Početni prikaz>
3
Odredite odredište na zaslonu s osnovnim značajkama skeniranja. Zaslon s osnovnim značajkama skeniranja
4
Po potrebi definirajte postavke skeniranja. Osnovni postupci skeniranja originala
5
Odaberite format datoteke.
Ukoliko želite odvojiti više slika i poslati ih kao odvojene datoteke, svaki od njih sastoji se on jedne stranice, pritisnite <Razdijeli na stranice>  unesite broj stranica po kojem ćete podijeliti  pritsnite <OK>. Ako želite skenirati slike kao jednu datoteku, pritisnite <Razdijeli na stranice>  <Poništi postavke>.
Za odabir PDF-a
Za odabir XPS-a
Za odabir Word formata za OOXML
Za odabir PowerPoint formata za OOXML
6
Pritisnite <OK>.
Ako kao format datoteke odaberete <PDF; OCR>, <XPS; OCR> ili <OOXML; OCR> i postavka <Smart Scan> je postavljena na <Uključeno> u <OCR (Text Searchable) Settings>, otkriva se usmjerenje izvornika, a ako je potrebno, prije slanja dokument se automatski rotira. <Postavke za OCR (pretraživi tekst)>
Ako odaberete <PDF> ili <XPS> kao format datoteke, možete postaviti <Kompakt> i <OCR (pretraživi tekst)> u isto vrijeme. U tom slučaju, <PDF; Kompakt> ili <XPS; Kompakt> prikazuje se kao format datoteke na zaslonu osnovnih funkcija slanja.
Ako odaberete <Word> za <OOXML>, možete postaviti brisanje skeniranih pozadinskih slika. Možete generirati Word datoteke koje je lako urediti bez neželjenih slika. <Dodaj pozadinske slike u Word datoteku>
Odaberite jezik ili jezičnu grupu prema jeziku koji je korišten u izvornicima za skeniranje. Postavke i jezici za OCR obradu

Rezultati OCR-a nisu zadovoljavajući

Kada stvorite PDF/XPS/OOXML datoteke u kojima se može pretraživati tekst, OCR (optičko prepoznavanje znakova) možda neće ispravno biti obrađeno. To može biti zbog toga što postavke na uređaju ili jezik, vrsta znakova ili format izvornog dokumenta nisu prikladni za OCR obradu.

Provjera postavki uređaja i podržanih jezika

Možete poboljšati OCR obradu prilagođavanjem postavki uređaja vezano uz prepoznavanje znakova prema izvornicima ili upotrebom odgovarajućih vrsta znakova ili fontova u izvornicima kako bi uređaj mogao prepoznati znakove.

Postavke i jezici za OCR obradu

Stavka
Detalji
Jezične postavke za prepoznavanje znakova
Kada je definiran jezik s OCR-om odabranim u <Format datoteke>:
Znakovi se prepoznavaju na temelju jezika odabranog za svaki format datoteke.
Kada jezik nije određen s odabranim OCR-om u <Format datoteke>:
Znakovi se prepoznaju na temelju jezika kojeg ste odabrali u <Promjena jezika/tipkovnice> (<Promjena jezika/tipkovnice>).*1
Prepoznatljivi azijski jezici
japanski, kineski (pojednostavnjeni), kineski (tradicionalni), korejski
Prepoznatljive vrste znakova i fontovi (azijski jezici)
Preporznatljivi europski jezici i jezične grupe
Jezici:
engleski, francuski, talijanski, njemački, španjolski, nizozemski, portugalski, albanski, katalonski, danski, finski, islandski, norveški, švedski, hrvatski, češki, mađarski, poljski, slovački, estonski, latvijski, litavski, ruski, grčki, turski
Jezične grupe:
zapadnoeuropski jezici (ISO)*2, srednjoeuropski jezici (ISO)*3, baltički jezici (ISO)*4
Prepoznatljive vrste znakova i fontovi (europski jezici)
*1 Prikazani jezici na popisu jezika u odjeljku mogu se razlikovati. Ako odaberete engleski, francuski, talijanski, njemački, španjolski, tajlandski ili vijetnamski, jezik se prepoznaje kao zapadnoeuropski (ISO).
*2 Uključujući engleski, francuski, talijanski, njemački, španjolski, nizozemski, portugalski, albanski, katalonski, danski, finski, islandski, norveški, švedski.
*3 Uključujući hrvatski, češki, mađarski, poljski, slovački.
*4 Uključujući estonski, latvijski i litvanski.

Prepoznatljive vrste znakova i fontovi (azijski jezici)

Stavka
Detalji
Vrsta prepoznatljivih znakova
Japanski:
Alfanumerički znakovi, Kana znakovi, Kanji znakovi (JIS prve razine i neki od JIS druge razine), simboli
Kineski (pojednostavnjeni):
Alfanumerički znakovi, kineski znakovi, simboli (GB2312-80)
Kineski (tradicionalni):
Alfanumerički znakovi, kineski znakovi, simboli (Big5)
Korejski:
Alfanumerički znakovi, kanji znakovi, korejski hangul znakovi, simboli (KSC5601)
Prepoznati fontovi
Podržano je više fontova. (Preporučen je tip Ming-cho.)
Znakovi u kurzivu neće biti prepoznati.
Fontovi korišteni za pretvorene znakove (Samo kada je Word odabran kao format datoteke.)
Japanski:
Azijski znakovi: MS Mincho
Europski znakovi: Century
Kineski (pojednostavljeni):
Azijski znakovi: SimSun
Europski znakovi: Calibri
Kineski (tradicionalni):
Azijski znakovi: PMingLiU
Europski znakovi: Calibri

Prepoznatljive vrste znakova i fontovi (europski jezici)

Stavka
Detalji
Vrsta prepoznatljivih znakova
Alfanumerički znakovi, posebni znakovi prepoznatog jezika*, simboli
Prepoznati fontovi
Podržano je više fontova. (preporučuju se Times, Century i Arial)
Znakovi u kurzivu će biti prepoznati.
Fontovi korišteni za pretvorene znakove (Samo kada je Word odabran kao format datoteke.)
Calibri
Kurziv se ne reproducira.
* Sljedeći posebni grčki znakovi mogu se prepoznati. Također je moguće prepoznati posebne znakove za svaki jezik. Neke posebne znakove nije moguće prepoznati, ovisno o jezicima.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Provjera formata izvornih dokumenata

Koristite izvornike pogodne za OCR obradu kako biste poboljšali točnost obrade prilikom stvaranja PDF/XPS/OOXML datoteka koje se mogu pretraživati.
Stavka
Detalji
Izvorni format
Ispisani dokumenti, dokumenti programa za obradu teksta (dokumenti koji se sastoje od teksta, grafike, fotografija ili tablica i bez nagiba znakova)
Format teksta
Vodoravni i okomiti tekst (mogu se prepoznati i dokumenti koji sadrže vodoravni i okomiti tekst)
Za europske jezike i korejski moguće je prepoznati samo vodoravno napisan tekst.
Dokumenti od jednog do tri stupca bez složenih postavki stupaca
Veličina znakova
8 do 40 točaka
Tablični format (samo za Word format)
Tablice koje ispunjavaju sljedeće uvjete:
Tablice se sastoje od kvadrata podijeljenih punim linijama
Tablice s do 32 stupca
Tablice s do 32 reda
Neki izvornici prikladni za OCR obradu možda neće biti pravilno obrađeni.
Visoka točnost možda neće postići s izvornicima koji uključuju veliku količinu teksta na svakoj stranici.
Znakovi mogu biti zamijenjeni pogrešnim znakovima ili mogu nedostajati zbog boje pozadine izvornika, oblika i veličine znakova ili nagnutih znakova.*
Odlomci, prijelomi redaka ili tablice možda se neće reproducirati.*
Neki dijelovi ilustracija, fotografija ili otisaka pečata možda će biti prepoznati kao znakovi i bit će zamijenjeni znakovima.*
* Kada je Word odabran kao format datoteke.
ALJS-09S