OCR-i funktsiooniga skannimine

See režiim võimaldab tuvastada skannitud dokumendi tekstiosa, teisendada tähemärgid tekstikujule ning luua tekstiotsimisvõimalusega PDF/XPS/OOXML (pptx/docx) faile. Võite määrata ka valiku <Kompaktne>, kui valite failivorminguks PDF- või XPS-faili.
Lisateavet selle funktsiooni kasutamiseks vajaliku lisavarustuse kohta leiate teemast Süsteemi valikvarustus.

OCR-iga skannimine

1
Asetage originaal. Originaalide asetamine
2
Vajutage nuppu <Skaneeri ja saada>. <Avakuva> kuva
3
Määrake skannimise põhifunktsioonide kuva sihtkoht. Skannimise põhiomaduste kuva
4
Määrake vajadusel skannimisseaded. Dokumentide skannimise põhitoimingud
5
Vali failivorming.
Kui soovite saata eraldi mitut kujutisega faili nii, et iga lehekülg oleks eraldi failina, siis vajutage <Lehtedeks jaotamine>  sisestage lehekülgede arv, mille järgi jagada  valige <OK>. Kui soovite salvestada kujutise üksiku failina, valige <Lehtedeks jaotamine>  <Tühista seaded>.
PDF-i valimine
XPS-i valimine
OOXML-is Wordi vormingu valimine
OOXML-is PowerPointi vormingu valimine
6
Vajutage nuppu <OK>.
Kui valite failivorminguks <PDF; OCR>, <XPS; OCR> või <OOXML; OCR> ja valik <Arukas skaneerimine> on määratud olekusse <Sees> valikus <OCR (Text Searchable) Settings>/<OCR (Prioritize Speed)>, tuvastatakse originaali paigutus ja vajadusel keeratakse dokumenti enne saatmist. <OCR (tekstituvastuse) seaded>
Kui valite failivorminguks <PDF> või <XPS>, saate teha valiku <Kompaktne> ja <OCR (tekstituvastus)> ühel ajal. Sellisel juhul kuvatakse faili tüübina saatmise põhifunktsioonide menüüs <PDF; kompaktne> või<XPS; kompaktne>.
Kui teete valiku <Word> vormingu <OOXML> jaoks, saate seadistada skannitud taustakujutiste kustutamise. Saate luua tarbetute kujutisteta Wordi faili, mida on kerge redigeerida. <Kaasa Wordi faili taustakujutised>

OCR tulemused pole rahuldavad

Kui loote teksiotsimisvõimalusega PDF/XPS/OOXML faili, ei pruugi OCR (märkide optiline tuvastamine) õigesti töötada. See võib olla põhjustatud sellest, et seadme seaded või originaaldokumendi keel, tähemärkide tüüp või formaat ei sobi OCR-i töötlemiseks.

Seadme seadete ja toetatud keelte kontrollimine

Saate parandada OCR-i töötlemist kohandades seadme seadeid selliselt, et see tuvastaks tähemärke originaali järgi või kasutades sobivate tähemärkide tüübi või fondiga originaali, mida seade suudab tuvastada.

OCR-i töötlemise seaded ja keeled

Käsk
Andmed
Tähemärkide tuvastamise keeleseaded
Kui keele määramisega üheaegselt on valitud OCR valikus <Failivorming>:
,tuvastatakse tähemärke vastavalt sellele, mis keeled iga failivormingu kohta valite.
Kui keele määramisega üheaegselt ei ole valitud OCR valikus <Failivorming>:
tuvastatakse tähemärke vastavalt sellele, mis keeled valite valikus <Keele/klaviatuuri lüliti> (<Keele/klaviatuuri lüliti>).*1
Tuvastatavad aasia keeled
Jaapani, hiina (lihtsustatud), hiina (traditsiooniline), korea
Tuvastatavad tähemärkide tüübid ja fondid (aasia keeled)
Tuvastatavad euroopa keeled ja keelerühmad
Keeled:
inglise, prantsuse, itaalia, saksa, hispaania, hollandi, portugali, albaania, katalaani, taani, soome, islandi, norra, rootsi, horvaatia, tšehhi, ungari, poola, slovaki, eesti, läti, leedu, vene, kreeka, türgi
Keelerühmad:
Lääne-Euroopa (ISO)*2, Kesk-Euroopa (ISO)*3, Balti (ISO)*4
Tuvastatavad tähemärkide tüübid ja fondid (euroopa keeled)
*1 Loendis kuvatavad keeled võivad erineda. Kui valite inglise, prantsuse, itaalia, saksa, hispaania, tai või vietnami keele, siis arvestatakse keelt Lääne-Euroopa keelena (ISO).
*2 Kaasa arvatud inglise, prantsuse, itaalia, saksa, hispaania, hollandi, portugali, albaania, katalaani, taani, soome, islandi, norra ja rootsi.
*3 Kaasa arvatud horvaatia, tšehhi, ungari, poola ja slovaki.
*4 Kaasa arvatud eesti, läti ja leedu.

Tuvastatavad tähemärkide tüübid ja fondid (aasia keeled)

Käsk
Andmed
Tuvastatavad tähemärgid
Jaapani:
tärgid, kana tähemärgid, kanji tähemärgid (JIS esimene tase, JIS teine tase (osaliselt)), sümbolid
Hiina (lihtsustatud):
tärgid, hiina tähemärgid, sümbolid (GB2312-80)
Hiina (traditsiooniline):
tärgid, hiina tähemärgid, sümbolid (Big5)
Korea:
tärgid, hiina tähemärgid, korea hanguli tähemärgid, sümbolid (KSC5601)
Tuvastatavad fondid
Toetatakse mitut fonti. (Soovitatav tüüp on Ming-cho.)
Kaldkirjas tähemärke ei tuvastata.
Teisendatud märkide puhul kasutatavad fondid (ainult siis, kui Wordi failitüüp on valitud)
Jaapani:
Aasia tähemärgid: MS Mincho
Euroopa tähemärgid: Century
Hiina (lihtsustatud):
Aasia tähemärgid: SimSun
Euroopa tähemärgid: Calibri
Hiina (traditsiooniline):
Aasia tähemärgid: PMingLiU
Euroopa tähemärgid: Calibri

Tuvastatavad tähemärkide tüübid ja fondid (euroopa keeled)

Käsk
Andmed
Tuvastatavad tähemärgid
Tärgid, tuvastatava keele erimärgid*, sümbolid
Tuvastatavad fondid
Toetatakse mitut fonti. (soovitatud fondid on Times, Century ja Arial.)
Kaldkirjas tähemärke tuvastatakse.
Teisendatud märkide puhul kasutatavad fondid (ainult siis, kui Wordi failitüüp on valitud)
Calibri
Kaldkirja stiili ei reprodutseerita.
* Järgmisi kreeka erimärke ei tuvastata. Tuvastatakse ka iga keele erimärke. Sõltuvalt keelest, ei pruugita kõiki erimärke tuvastada.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Originaaldokumentide vormingu kontrollimine

Töötlemise täpsuse parandamiseks PDF/XPS/OOXML failide loomisel, kasutage OCR-i töötlemiseks sobivaid originaale.
Käsk
Andmed
Originaali formaat
Prinditud dokumendid, tekstitöötlusdokumendid (sisaldavad ainult teksti, graafikat, fotosid, tabeleid ja mille tähemärgid ei ole kaldus)
Tekstivorming
Horisontaalne ja vertikaalne kiri (tuvastatakse dokumente nii horisontaa- kui ka vertikaalkirjas)
Euroopa keelte ja korea teksi puhul saab tuvastada ainult horisontaalkirja.
Ühe kuni kolme veeruga dokumendid ilma keeruliste veeruseadetega
Tähemärgi suurus
8–40 punkti
Tabeli vorming (ainult Wordi vorming)
Tabelitele kehtivad järgmised tingimused.
Tabel koosneb joontega eraldatud ruutudest.
Kuni 32 veeruga tabelid
Kuni 32 reaga tabelid
Mõnda OCR-i töötlemiseks sobivat originaali ei pruugita töödelda õigesti.
Igal lehel suurt hulka teksti sisaldavate originaalide puhul ei pruugi saavutada täpset tulemust.
Tähemärke võidakse asendada soovimatute tähemärkidega või need kaduma minna originaali taustavärvi, tähemärkide vormi ja suuruse või kaldkirja tõttu.*
Peatükke, reavahetusi ja tabeleid ei pruugita reprodutseerida.*
Mõnda osa jooniselt, fotolt või pitserilt võidakse tuvastada tähemärgina ja asendatakse tähemärgiga.*
* Kui failivorminguks on valitud Word.
6W1W-072