|
Ta način omogoča izvajanje OCR (optično prepoznavanje znakov) za ustvarjanje izvlečka podatkov iz optično prebrane slike, ki so lahko prepoznani kot besedilo, in ustvarjanje datoteke PDF/XPS/OOXML (pptx/docx), ki omogoča iskanje besedila. Nastavite lahko tudi <Kompakt>, če za obliko zapisa datoteke izberete PDF ali XPS.
|
1
|
Izberite <PDF> pritisnite <Nast. podrob.> <OCR (Iskanje teksta)>.
|
2
|
Če želite spremeniti jezik za OCR, pritisnite <Jezik OCR> izberite jezik in pritisnite <OK>.
|
1
|
Izberite <XPS> pritisnite <Nast. podrob.> <OCR (Tekst za iskanje)>.
|
2
|
Če želite spremeniti jezik za OCR, pritisnite <Jezik OCR> izberite jezik pritisnite <OK>.
|
1
|
Izberite <OOXML> s spustnega seznama izberite <Word>.
|
1
|
Izberite <OOXML> s spustnega seznama izberite <PowerPoint>.
|
2
|
Izberite <Nast. podrob.> <OCR (Iskanje teksta)>.
|
3
|
Če želite spremeniti jezik za OCR, pritisnite <Jezik OCR> izberite jezik in pritisnite <OK>.
|
|
Če kot obliko zapisa datoteke izberete <PDF; OCR>, <XPS; OCR> ali <OOXML; OCR> in je možnost <Izpop. sken.> nastavljena na <Da> v nastavitvah <OCR (Text Searchable) Settings> naprava zazna usmerjenost izvirnika in ga samodejno zavrti, preden dokument pošlje. <Nastavitve OCR (Tekst za iskanje)>
Če kot obliko zapisa datoteke izberete <PDF> ali <XPS>, lahko hkrati nastavite <Kompakt> in <OCR (Tekst za iskanje)>. V tem primeru je kot oblika zapisa datoteke na zaslonu z osnovnimi nastavitvami optičnega branja in pošiljanja prikazana možnost <PDF; Compact> ali <XPS; Kompakt>.
Če za <OOXML> izberete <Word>, lahko nastavite, da se optično prebrane slike ozadja izbrišejo. Ustvarite lahko Wordove datoteke brez neželenih slik, ki jih je enostavno urejati. <Vključitev slik v ozadju v datoteko Word>
Izberite en jezik ali jezikovno skupino glede na jezik, uporabljen v izvirnikih za optično branje. Nastavitve in jeziki za OCR
|
Element
|
Podrobnosti
|
Jezikovne nastavitve za prepoznavanje znakov
|
Ko je jezik določen z izbranim OCR v <Datot. format>:
Znaki se prepoznavajo glede na jezik, ki ga izberete za vsako obliko zapisa datoteke. Ko jezik ni določen z izbranim OCR v <Datot. format>:
Znaki se prepoznavajo glede na jezik, ki ga izberete v nastavitvi <Preklop Jezik/Tipkovnica> (<Preklop Jezik/Tipkovnica>).*1 |
Podprti azijski jeziki za prepoznavanje znakov
|
Japonščina, kitajščina (poenostavljena), kitajščina (tradicionalna) in korejščina
Podprte vrste znakov in pisave (azijski jeziki) |
Podprti evropski jeziki in jezikovne skupine za prepoznavanje znakov
|
Jeziki:
angleščina, francoščina, italijanščina, nemščina. španščina, nizozemščina, portugalščina, albanščina, katalonščina, danščina, finščina, islandščina, norveščina, švedščina, hrvaščina, češčina, madžarščina, poljščina, slovaščina, estonščina, letonščina, litovščina, ruščina, grščina in turščina Jezikovne skupine:
zahodnoevropska (ISO)*2, srednjeevropska (ISO)*3, baltska (ISO)*4 Podprte vrste znakov in pisave (evropski jeziki) |
Element
|
Podrobnosti
|
Podprte vrste znakov za prepoznavanje znakov
|
Japonščina:
alfanumerični zanki, znaki Kana, znaki Kanji (prva raven JIS, delno druga raven JIS), simboli Kitajščina (poenostavljena):
alfanumerični znaki, kitajski znaki, simboli (GB2312-80) Kitajščina (tradicionalna):
alfanumerični znaki, kitajski znaki, simboli (Big5) Korejščina:
alfanumerični znaki, kitajski znaki, znaki Hangul, simboli (KSC5601) |
Podprte pisave za prepoznavanje znakov
|
Podprtih je več pisav. (Priporočena je pisava Ming-cho.)
Ležečih znakov ni mogoče prepoznati.
|
Pisave, ki se uporabljajo za pretvorjene znake (samo če je za obliko zapisa datoteke izbran Word)
|
Japonščina:
azijski znaki: MS Mincho evropski znaki: Century Kitajščina (poenostavljena):
azijski znaki: SimSun evropski znaki: Calibri Kitajščina (tradicionalna):
azijski znaki: PMingLiU evropski znaki: Calibri |
Element
|
Podrobnosti
|
Podprte vrste znakov za prepoznavanje znakov
|
Alfanumerični znaki, posebni znaki za prepoznani jezik*, simboli
|
Podprte pisave za prepoznavanje znakov
|
Podprtih je več pisav. (Priporočene so pisave Times, Century in Arial.)
Ležeče znake je mogoče prepoznati.
|
Pisave, ki se uporabljajo za pretvorjene znake (samo če je za obliko zapisa datoteke izbran Word)
|
Calibri
Ležečega sloga ni mogoče prepoznati.
|
Element
|
Podrobnosti
|
Izvirni format
|
Natisnjeni dokumenti, dokumenti urejevalnika besedila Word (dokumenti, sestavljeni iz besedila, grafik, fotografij ali tabel in brez nagnjenih znakov)
|
Besedilna oblika
|
Vodoravna in navpična smer besedila (prepoznati je mogoče tudi dokumente, ki vsebujejo vodoravno in navpično smer besedila)
Za evropske jezike in korejščino je mogoče prepoznati le vodoravno napisano besedilo.
Dokumenti z enim do tremi stolpci besedila brez zapletenih nastavitev za stolpce
|
Velikost znakov
|
8 do 40 točk
|
Tabelarična oblika (samo za obliko zapisa Word)
|
Tabele, ki ustrezajo naslednjim pogojem:
Tabele, ki so sestavljene iz kvadratov, ki so razdeljeni s polnimi črtami
Tabele z do 32 stolpci
Tabele z do 32 vrsticami
|
|
Nekateri izvirniki, primerni za OCR, morda ne bodo pravilno prepoznani.Pri izvirnikih z veliko količino besedila na vsaki strani velika natančnost morda ne bo mogoča.
Znaki se lahko zamenjajo z neustreznimi znaki ali pa so izpuščeni zaradi barve ozadja izvirnika, oblike in velikosti znakov ali nagnjenih znakov.*
Odstavkov, prelomov vrstic ali tabel morda ni mogoče prepoznati.*
Nekateri deli ilustracij, fotografij ali odtisi so lahko prepoznani kot znaki in so nadomeščeni z znaki.*
* Če je za obliko zapisa datoteke izbran Word.
|