|
با این حالت میتوانید OCR (تشخیص نویسه نوری) را برای استخراج دادهای اجرا کنید که میتواند بهعنوان متن از تصویر اسکن شده تشخیص داده شود و یک فایل PDF/XPS/OOXML (pptx/docx) ایجاد کنید که قابل جستجو باشد. اگر PDF یا XPS را بهعنوان فرمت فایل انتخاب نکنید، میتوانید <Compact> را هم تنظیم کنید.
|
1
|
<PDF> را انتخاب کنید، <Set Details> <OCR (Text Searchable)> را فشار دهید.
|
2
|
برای تغییر زبان جهت استفاده از OCR، <OCR Language> را فشار دهید، یک زبان را انتخاب کنید، <OK> را فشار دهید.
|
1
|
<XPS> را انتخاب کنید <Set Details> <OCR (Text Searchable)> را فشار دهید.
|
2
|
برای تغییر زبان جهت استفاده از OCR، <OCR Language> را فشار دهید، یک زبان را انتخاب کنید، <OK> را فشار دهید.
|
1
|
<OOXML> را انتخاب کنید <Word> را از فهرست کشویی انتخاب کنید.
|
1
|
گزینه <OOXML> را انتخاب کنید گزینه <PowerPoint> را از لیست کشویی انتخاب کنید.
|
2
|
<Set Details> <OCR (Text Searchable)> را انتخاب کنید.
|
3
|
برای تغییر زبان جهت استفاده از OCR، <OCR Language> را فشار دهید، یک زبان را انتخاب کنید، <OK> را فشار دهید.
|
|
اگر <PDF; OCR>، <XPS; OCR> یا <OOXML; OCR> این را بهعنوان فرمت فایل انتخاب کنید و <Smart Scan> در <OCR (Text Searchable) Settings> روی <On> تنظیم شود، جهت سند اصلی تشخیص داده میشود و در صورت لزوم سند قبل از ارسال بهطور خودکار چرخانده میشود. <OCR (Text Searchable) Settings>
اگر <PDF> یا <XPS> را بهعنوان فرمت فایل انتخاب کنید، میتوانید <Compact> و <OCR (Text Searchable)> را همزمان تنظیم کنید. در این حالت، <PDF; Compact> یا <XPS; Compact> بهعنوان فرمت فایل در صفحه ویژگیهای اصلی ارسال و اسکن نشان داده میشود.
اگر <Word> را برای <OOXML> انتخاب کنید میتوانید تنظیم کنید تصاویر پس زمینه اسکن شده حذف شوند. میتوانید فایلهای Word ایجاد کنید که ویرایش آنها بدون تصاویر ناخواسته آسان باشد. <Include Background Images in Word File>
بر اساس زبان مورد استفاده در اسناد اصلی که باید اسکن شوند، یک زبان یا یک گروه را انتخاب کنید. تنظیمات و زبانها برای پردازش OCR
|
مورد
|
جزئیات
|
تنظیمات زبان برای تشخیص نویسه
|
زمانی که زبان با OCR انتخاب شده در <File Format> مشخص میشود:
نویسهها بر اساس زبانی که برای هر فرمت فایل انتخاب میکنید تشخیص داده میشوند. زمانی که زبان با OCR انتخاب شده در <File Format> مشخص نمیشود:
نویسهها بر اساس زبانی که در <Switch Language/Keyboard> (<Switch Language/Keyboard>) انتخاب میکنید تشخیص داده میشوند.*1 |
زبانهای آسیایی قابل تشخیص
|
ژاپنی، چینی (ساده شده)، چینی (سنتی)، کره ای
قلمها و انواع نویسههای قابل تشخیص (زبانهای آسیایی) |
گروههای زبانی و زبانهای اروپایی قابل تشخیص
|
زبانها:
انگلیسی، فرانسوی، ایتالیایی، آلمانی، اسپانیایی، هلندی، پرتغالی، آلبانیایی، کاتالان، دانمارکی، فنلاندی، ایسلندی، نروژی، سوئدی، کرواتی، چک، مجارستانی، لهستانی، اسلواکی، استونی، لتونی، لیتوانیایی، روسی، یونانی، ترکی گروههای زبانی:
اروپای غربی (ISO)*2، اروپای مرکزی (ISO)*3، بالتیک (ISO)*4 قلمها و انواع نویسههای قابل تشخیص (زبانهای اروپایی) |
مورد
|
جزئیات
|
انواع نویسههای قابل تشخیص
|
ژاپنی:
نویسههای الفبایی عددی، نویسههای کانا، نویسههای کانجی (JIS سطح اول و تعدادی JIS سطح دوم)، نمادها چینی (ساده شده):
نویسههای الفبایی عددی، نویسههای چینی، نمادها (GB2312-80) چینی (سنتی):
نویسههای الفبایی عددی، نویسههای چینی، نمادها (Big5) کره ای:
نویسههای الفبایی عددی، نویسههای چینی، نویسههایهانگول، نمادها (KSC5601) |
قلمهای قابل تشخیص
|
چندین قلم پشتیبانی میشود. (نوع مینگ-چو توصیه میشود.)
نویسههای ایتالیایی قابل تشخیص نیست.
|
قلمهای مورد استفاده برای نویسههای تبدیل شده (تنها زمانی که Word بهعنوان فرمت فایل انتخاب شود)
|
ژاپنی:
نویسههای آسیایی: MS Mincho نویسههای اروپایی: Century چینی (ساده شده):
نویسههای آسیایی: SimSun نویسههای اروپایی: Calibri چینی (سنتی):
نویسههای آسیایی: PMingLiU نویسههای اروپایی: Calibri |
مورد
|
جزئیات
|
انواع نویسههای قابل تشخیص
|
نویسههای الفبایی عددی، نویسههای خاص زبان تشخیص داده شده*، نمادها
|
قلمهای قابل تشخیص
|
چندین قلم پشتیبانی میشود. (Times، Century و Arial توصیه میشوند.)
نویسههای کج قابل تشخیص است.
|
قلمهای مورد استفاده برای نویسههای تبدیل شده (تنها زمانی که Word بهعنوان فرمت فایل انتخاب شود)
|
Calibri
سبک مورب بازتولید نمیشود.
|
مورد
|
جزئیات
|
فرمت سند اصلی
|
اسناد چاپی، اسناد پردازشگر Word (اسناد حاوی متن، گرافیک، عکس یا جدول و بدون نویسه کچ)
|
فرمت متنی
|
نوشتههای افقی و عمودی (اسناد حاوی نوشتههای افقی و عمودی نیز قابل تشخیص هستند)
برای زبانهای اروپایی و متن کره ای، تنها نوشتههای افقی قابل تشخیص است.
اسناد یک تا سه ستونی بدون تنظیمات پیچیده ستون
|
اندازه نویسه
|
8 تا 40 نقطه
|
فرمت جدول (فقط برای فرمت Word)
|
جدولهایی که با شرایط زیر مطابقت دارند:
جدولهای حاوی مربعهایی که با خطوط تقسیم شده اند
جدولهای دارای حداکثر 32 ستون
جدولهای دارای حداکثر 32 ردیف
|
|
برخی اسناد اصلی مناسب برای پردازش OCR ممکن است به درستی پردازش نشوند.با اسناد اصلی که شامل مقدار زیادی متن در هر صفحه میباشند، ممکن است دقت بالایی به دست نیاید.
ممکن است به دلیل رنگ پس زمینه سند اصلی، فرم و اندازه نویسهها یا نویسههای کج، نویسهها با نویسههای ناخواسته جایگزین شوند یا جا بیفتند.*
ممکن است پاراگرافها، شکستهای خط یا جدولها بازتولید نشوند.*
ممکن است برخی از بخشهای تصاویر، عکسها یا چاپهای مهری بهعنوان نویسه تشخیص داده شوند و با نویسهها جایگزین شوند.*
* وقتی Word بهعنوان فرمت فایل انتخاب شود.
|