|
Tällä toiminnolla voit suorittaa OCR:n (optical character recognition) irrottaaksesi skannatusta kuvasta datan, joka voidaan tunnistaa tekstiksi skannatusta kuvasta ja luoda haettavan PDF/XPS/OOXML (pptx/docx) -tiedoston. Voit myös valita <Pakattu>, jos valitset PDF- tai XPS-tiedostomuodon.
|
1
|
Valitse <PDF> valitse <OCR (priorisoitu nopeus)> tai <OCR (priorisoitu tarkkuus)>.
OCR (priorisoitu tarkkuus) -toimintoa ei voida suorittaa, jos <Jäljitys & Pehmennys> on valittu asetuksen <OCR (priorisoitu tarkkuus)> kanssa.
Jos määrität sekä <OCR (priorisoitu tarkkuus)> että <Pakattu>, <Kuvan laatutaso pakkaukselle> -asetus poistetaan käytöstä. <Kuvan laatutaso pakkaukselle>
Jos luot PDF-tiedoston käyttäen asetuksia <OCR (priorisoitu tarkkuus)> ja <Pakattu>, kuvanlaatu voi poiketa PDF-tiedostosta, joka on luotu asetuksilla <OCR (priorisoitu nopeus)> ja <Pakattu>.
Jos haluat vaihtaa OCR:n käyttämän kielen, valitse <OCR-kieli> valitse kieli paina <OK>.
Vain eurooppalaisia kieliä voidaan tunnistaa vaihtoehdolla <OCR (priorisoitu tarkkuus)>. Asetukset ja kielet OCR-tekstintunnistukseen
|
1
|
Valitse <XPS> valitse <OCR (Tekstihaku)>.
Jos haluat vaihtaa OCR:n käyttämän kielen, valitse <OCR-kieli> valitse kieli paina <OK>.
|
1
|
Valitse <OOXML> <Word>.
Vaihda OCR-kieli valitsemalla <Muuta> valitse kieli tai kieliryhmä valitse <OK>.
Valitse kieli tai kieliryhmä sen mukaan mitä kieltä käytetään skannatuissa asiakirjoissa.
|
1
|
Valitse <OOXML> <PowerPoint> <OCR (Tekstihaku)>.
|
2
|
Valitse OCR-toiminnossa käytettävä kieli valitse <OK>.
|
|
Jos valitset tiedostomuodoksi <PDF (OCR)>, <XPS (OCR)> tai <OOXML (OCR)> ja <Älyskannaus>-asetuksena on <Kyllä> kohdassa <OCR (Text Searchable) Settings>/<OCR (priorisoitu nopeus)>, alkuperäisen suunta tunnistetaan ja asiakirjaa käännetään tarvittaessa automaattisesti ennen sen lähettämistä. <OCR (Tekstihaku) -asetukset>
Jos valitset tiedostomuodoksi <PDF> tai <XPS>, voit valita asetukset <Pakattu> ja <OCR (Tekstihaku)> samanaikaisesti. Tässä tapauksessa <PDF (Pakattu)> tai <XPS (pakattu)> näkyy tiedostomuotona skannauksen ja lähetyksen perustoimintonäytössä.
Jos valitset <Word> kohdassa <OOXML>, voit määrittää skannatut taustakuvat poistettavaksi. Voit luoda Word-tiedostoja, joiden muokkaus on helppoa ilman tarpeettomia taustakuvia. <Sisällytä taustakuvat Word-tiedostoon>
Jos käytät <Skannaa ja tallenna> -toimintoa, voit valita tekstintunnistustoiminnon vain, kun <Word> on valittu kohdassa <OOXML> tai <OCR (priorisoitu tarkkuus)> on valittu kohdassa <PDF>.
|
Kohde
|
Tiedot
|
Kieliasetukset tekstintunnistukseen
|
Kun määritetään kieli ja OCR-tekstintunnistus on valittu kohdassa <Tiedostomuoto>:
Merkit tunnistetaan sen kielen perusteella, jonka valitset kullekin tiedostomuodolle. Kun kieltä ei ole määritetty ja OCR-tekstintunnistus on valittu kohdassa <Tiedostomuoto>:
Merkit tunnistetaan sen kielen perusteella, jonka valitset kohdassa <Vaihda kieli/näppäimistö> (<Vaihda kieli/näppäimistö>).*1 |
Tunnistettavat aasialaiset kielet*2
|
Japani, kiina (yksinkertaistettu), kiina (perinteinen), korea
Tunnistettavat merkkityypit ja fontit (aasialaiset kielet) |
Tunnistettavat eurooppalaiset kielet ja kieliryhmät
|
Kielet:
englanti, ranska, italia, saksa, espanja, hollanti, portugali, albania, katalaani, tanska, suomi, islanti, norja, ruotsi, kroatia, tšekki, unkari, puola, slovakki, viro, latvia, liettua, venäjä, kreikka, turkki, slovenia*3, romania*3, bulgaria*3, heprea*3 Kieliryhmät:
länsieurooppalainen (ISO)*4, keskieurooppalainen (ISO)*5, baltialainen (ISO)*6 Tunnistettavat merkkityypit ja fontit (eurooppalaiset kielet) |
Kohde
|
Tiedot
|
Tunnistettavat merkkityypit
|
Japani:
Aakkosnumeeriset merkit, Kana-merkit, Kanji-merkit (ensimmäisen tason JIS ja osa toisesta JIS-tasosta), symbolit Kiina (yksinkertaistettu):
Aakkosnumeeriset merkit, kiinalaiset merkit, symbolit (GB2312-80) Kiina (perinteinen):
Aakkosnumeeriset merkit, kiinalaiset merkit, symbolit (Big5) Korea:
Aakkosnumeeriset merkit, kiinalaiset merkit, Hangul-merkit, symbolit (KSC5601) |
Tunnistettavat fontit
|
Useita fontteja tuetaan. (Ming-cho-tyyppiä suositellaan.)
Kursivoituja merkkejä ei tunnisteta.
|
Fontit, joita käytetään muunnettuihin merkkeihin (Vain kun Word on valittu tiedostomuodoksi)
|
Japani:
Aasialaiset merkit: MS Mincho Eurooppalaiset merkit: Century Kiina (yksinkertaistettu):
Aasialaiset merkit: SimSun Eurooppalaiset merkit: Calibri Kiina (perinteinen):
Aasialaiset merkit: PMingLiU Eurooppalaiset merkit: Calibri |
Kohde
|
Tiedot
|
Tunnistettavat merkkityypit
|
Aakkosnumeeriset merkit, tunnistetun kielen erikoismerkit*1, Symbolit
|
Tunnistettavat fontit
|
Useita fontteja tuetaan. (Suositeltuja Times, Century ja Arial.)*2
Kursiivia ei tunnisteta.
|
Fontit, joita käytetään muunnettuihin merkkeihin (Vain kun Word on valittu tiedostomuodoksi)
|
Calibri
Kursiivityyliä ei kopioida.
|
Kohde
|
Tiedot
|
Alkuperäinen muoto
|
Tulostetut asiakirjat, Word-asiakirjat (asiakirjat jotka sisältävät tekstiä, grafiikkaa tai taulukoita, mutta ei vinoja kirjaimia)
|
Tekstin muoto
|
Vaakasuoraa ja pystysuoraa kirjoitusta (myös sekä vaakasuoraa että pystysuoraa kirjoitusta sisältävät asiakirjat voidaan tunnistaa)
Vain vaakasuuntainen kirjoitus voidaan tunnistaa eurooppalaisista kielistä ja koreasta.
Yhdestä kolmeen saraketta sisältävät asiakirjat ilman monimutkaisia sarakeasetuksia.
|
Merkkikoko
|
8–40 pistettä
|
Taulukon muoto (Vain Word muoto)
|
Taulukot jotka täyttävät seuraavat ehdot:
Taulukot on muodostettu neliöistä ja jaettu yhtenäisin viivoin
Taulukoissa enintään 32 saraketta
Taulukoissa enintään 32 riviä
|
|
Joitakin taulukoita jotka soveltuvat OCR-käsittelyyn ei ehkä käsitellä oikein.Suurta tarkkuutta ei ehkä saavuteta alkuperäisillä jotka sisältävät paljon tekstiä joka sivulla.
Merkit voivat vaihtua toisiin merkkeihin tai puuttua, johtuen asiakirjan taustaväristä, merkkien muodosta ja koosta, tai vinoista merkeistä.*
Kappaleita, rivinvaihtoja tai taulukoita ei ehkä kopioida.*
Joitakin kuvien osia, valokuvia tai sinettikuvioita saatetaan tunnistaa merkeiksi ja korvata merkeillä.*
* Kun Word on valittu tiedostomuodoksi.
|