Tällä toiminnolla voit suorittaa OCR:n (optical character recognition) irrottaaksesi skannatusta kuvasta datan, joka voidaan tunnistaa tekstiksi skannatusta kuvasta ja luoda haettavan PDF/XPS/OOXML (pptx/docx) -tiedoston. Voit myös valita <Pakattu>, jos valitset PDF- tai XPS-tiedostomuodon. |
1 | Valitse <PDF> valitse <Aseta tiedot> <OCR (Tekstihaku)>. |
2 | Voit vaihtaa OCR-toiminnossa käytettävän kielen valitsemalla <OCR-kieli> valitse kieli ja valitse <OK>. |
1 | Valitse <XPS> valitse <Aseta tiedot> <OCR (Tekstihaku)>. |
2 | Jos haluat vaihtaa OCR:n käyttämän kielen, valitse <OCR-kieli> valitse kieli valitse <OK>. |
1 | Valitse <OOXML> valitse <Word> avattavasta luettelosta. |
1 | Valitse <OOXML> valitse <PowerPoint> avattavasta luettelosta. |
2 | Valitse <Aseta tiedot> <OCR (Tekstihaku)>. |
3 | Voit vaihtaa OCR-toiminnossa käytettävän kielen valitsemalla <OCR-kieli> valitse kieli ja valitse <OK>. |
Jos valitset tiedostomuodoksi <PDF; OCR>, <XPS; OCR> tai <OOXML; OCR> ja <Älyskannaus>-asetuksena on <Kyllä> kohdassa <OCR (Tekstihaku) -asetukset>, alkuperäisen suunta tunnistetaan ja asiakirjaa käännetään tarvittaessa automaattisesti ennen sen lähettämistä. <OCR (Tekstihaku) asetukset> Jos valitset tiedostomuodoksi <PDF> tai <XPS>, voit valita asetukset <Pakattu> ja <OCR (Tekstihaku)> samanaikaisesti. Tässä tapauksessa <PDF; pakattu> tai <XPS; pakattu> näkyy tiedostomuotona skannauksen ja lähetyksen perustoimintonäytössä. Jos valitset <Word> kohdassa <OOXML>, voit määrittää skannatut taustakuvat poistettavaksi. Voit luoda Word-tiedostoja, joiden muokkaus on helppoa ilman tarpeettomia taustakuvia. <Sisällytä taustakuvat Word-tiedostoon> Valitse kieli tai kieliryhmä skannatuissa alkuperäiskappaleissa käytetyn kielen mukaan. OCR-tekstintunnistuksen asetukset ja kielet |
Kohde | Tiedot |
Kieliasetukset tekstintunnistukseen | Kun määritetään kieli ja OCR-tekstintunnistus on valittu kohdassa <Tiedostomuoto>: Merkit tunnistetaan sen kielen perusteella, jonka valitset kullekin tiedostomuodolle. Kun kieltä ei ole määritetty ja OCR-tekstintunnistus on valittu kohdassa <Tiedostomuoto>: Merkit tunnistetaan sen kielen perusteella, jonka valitset kohdassa <Vaihda kieli/näppäimistö> (<Vaihda kieli/näppäimistö>).*1 |
Tunnistettavat aasialaiset kielet | Japani, kiina (yksinkertaistettu), kiina (perinteinen), korea Tunnistettavat merkkityypit ja fontit (aasialaiset kielet) |
Tunnistettavat eurooppalaiset kielet ja kieliryhmät | Kielet: englanti, ranska, italia, saksa, espanja, hollanti, portugali, albania, katalaani, tanska, suomi, islanti, norja, ruotsi, kroatia, tšekki, unkari, puola, slovakki, viro, latvia, liettua, venäjä, kreikka, turkki Kieliryhmät: länsieurooppalainen (ISO)*2, keskieurooppalainen (ISO)*3, baltialainen (ISO)*4 Tunnistettavat merkkityypit ja fontit (eurooppalaiset kielet) |
Kohde | Tiedot |
Tunnistettavat merkkityypit | Japani: Aakkosnumeeriset merkit, Kana-merkit, Kanji-merkit (ensimmäisen tason JIS ja osa toisesta JIS-tasosta), symbolit Kiina (yksinkertaistettu): Aakkosnumeeriset merkit, kiinalaiset merkit, symbolit (GB2312-80) Kiina (perinteinen): Aakkosnumeeriset merkit, kiinalaiset merkit, symbolit (Big5) Korea: Aakkosnumeeriset merkit, kiinalaiset merkit, Hangul-merkit, symbolit (KSC5601) |
Tunnistettavat fontit | Useita fontteja tuetaan. (Ming-cho-tyyppiä suositellaan.) Kursivoituja merkkejä ei tunnisteta. |
Fontit, joita käytetään muunnettuihin merkkeihin (Vain kun Word on valittu tiedostomuodoksi) | Japani: Aasialaiset merkit: MS Mincho Eurooppalaiset merkit: Century Kiina (yksinkertaistettu): Aasialaiset merkit: SimSun Eurooppalaiset merkit: Calibri Kiina (perinteinen): Aasialaiset merkit: PMingLiU Eurooppalaiset merkit: Calibri |
Kohde | Tiedot |
Tunnistettavat merkkityypit | Aakkosnumeeriset merkit, tunnistetun kielen erikoismerkit*, symbolit |
Tunnistettavat fontit | Useita fontteja tuetaan. (Suositeltuja Times, Century ja Arial.) Kursiivia ei tunnisteta. |
Fontit, joita käytetään muunnettuihin merkkeihin (Vain kun Word on valittu tiedostomuodoksi) | Calibri Kursiivityyliä ei kopioida. |
Kohde | Tiedot |
Alkuperäinen muoto | Tulostetut asiakirjat, Word-asiakirjat (asiakirjat jotka sisältävät tekstiä, grafiikkaa tai taulukoita, mutta ei vinoja kirjaimia) |
Tekstin muoto | Vaakasuoraa ja pystysuoraa kirjoitusta (myös sekä vaakasuoraa että pystysuoraa kirjoitusta sisältävät asiakirjat voidaan tunnistaa) Vain vaakasuuntainen kirjoitus voidaan tunnistaa eurooppalaisista kielistä ja koreasta. Yhdestä kolmeen saraketta sisältävät asiakirjat ilman monimutkaisia sarakeasetuksia. |
Merkkikoko | 8–40 pistettä |
Taulukon muoto (Vain Word muoto) | Taulukot jotka täyttävät seuraavat ehdot: Taulukot on muodostettu neliöistä ja jaettu yhtenäisin viivoin Taulukoissa enintään 32 saraketta Taulukoissa enintään 32 riviä |
Joitakin taulukoita jotka soveltuvat OCR-käsittelyyn ei ehkä käsitellä oikein.Suurta tarkkuutta ei ehkä saavuteta alkuperäisillä jotka sisältävät paljon tekstiä joka sivulla. Merkit voivat vaihtua toisiin merkkeihin tai puuttua, johtuen asiakirjan taustaväristä, merkkien muodosta ja koosta, tai vinoista merkeistä.* Kappaleita, rivinvaihtoja tai taulukoita ei ehkä kopioida.* Joitakin kuvien osia, valokuvia tai sinettikuvioita saatetaan tunnistaa merkeiksi ja korvata merkeillä.* * Kun Word on valittu tiedostomuodoksi. |