|
با این حالت می توانید OCR (تشخیص نویسه نوری) را برای استخراج داده ای اجرا کنید که می تواند به عنوان متن از تصویر اسکن شده تشخیص داده شود و یک فایل PDF/XPS/OOXML (pptx/docx) ایجاد کنید که قابل جستجو باشد. اگر PDF یا XPS را به عنوان فرمت فایل انتخاب نکنید، می توانید <Compact> را هم تنظیم کنید.
|
1
|
<PDF> را انتخاب کنید <Set Details> <OCR (Text Searchable)> را فشار دهید.
|
2
|
برای تغییر زبان جهت استفاده از OCR، <OCR Language> را فشار دهید، یک زبان را انتخاب کنید، <OK> را فشار دهید.
|
1
|
<XPS> را انتخاب کنید <Set Details> <OCR (Text Searchable)> را فشار دهید.
|
2
|
برای تغییر زبان جهت استفاده از OCR، <OCR Language> را فشار دهید، یک زبان را انتخاب کنید، <OK> را فشار دهید.
|
1
|
<OOXML> را انتخاب کنید <Word> را از لیست کشویی انتخاب کنید.
|
1
|
<OOXML> را انتخاب کنید <PowerPoint> را از لیست کشویی انتخاب کنید.
|
|
اگر <PDF; OCR>، <XPS; OCR> یا <OOXML; OCR> را به عنوان فرمت فایل انتخاب کنید و <Smart Scan> روی <On> در <OCR (Text Searchable) Settings> تنظیم شده باشد، جهت سند اصلی تشخیص داده می شود و در صورت لزوم سند قبل از ارسال به طور خودکار چرخانده می شود. <OCR (Text Searchable) Settings>
اگر <PDF> یا <XPS> را به عنوان فرمت فایل انتخاب کنید، می توانید <Compact> و <OCR (Text Searchable)> را همزمان تنظیم کنید. در این حالت، <PDF; Compact> یا <XPS; Compact> به عنوان فرمت فایل در صفحه ویژگی های اصلی ارسال و اسکن نشان داده می شود.
اگر <Word> را برای <OOXML> انتخاب کنید می توانید تنظیم کنید تصاویر پس زمینه اسکن شده حذف شوند. می توانید فایل های Word ایجاد کنید که ویرایش آنها بدون تصاویر ناخواسته آسان باشد. <Include Background Images in Word File>
یک زبان یا یک گروه را بر اساس زبان مورد استفاده در اسناد اصلی که باید اسکن شوند، انتخاب کنید. تنظیمات و زبان ها برای پردازش OCR
|
مورد
|
جزئیات
|
تنظیمات زبان برای تشخیص نویسه
|
زمانی که زبان با OCR انتخاب شده در <File Format> مشخص می شود:
نویسه ها بر اساس زبانی که برای هر فرمت فایل انتخاب می کنید تشخیص داده می شوند. زمانی که زبان با OCR انتخاب شده در <File Format> مشخص نمی شود:
نویسه ها بر اساس زبانی که در <Switch Language/Keyboard> (<Switch Language/Keyboard>) انتخاب می کنید تشخیص داده می شوند.*1 |
زبان های آسیایی قابل تشخیص
|
ژاپنی، چینی (ساده شده)، چینی (سنتی)، کره ای
قلم ها و انواع نویسه های قابل تشخیص (زبان های آسیایی) |
گروه های زبانی و زبان های اروپایی قابل تشخیص
|
زبان ها:
انگلیسی، فرانسوی، ایتالیایی، آلمانی، اسپانیایی، هلندی، پرتغالی، آلبانیایی، کاتالان، دانمارکی، فنلاندی، ایسلندی، نروژی، سوئدی، کرواتی، چک، مجارستانی، لهستانی، اسلواکی، استونی، لتونی، لیتوانیایی، روسی، یونانی، ترکی گروه های زبانی:
اروپای غربی (ISO)*2، اروپای مرکزی (ISO)*3، بالتیک (ISO)*4 قلم ها و انواع نویسه های قابل تشخیص (زبان های اروپایی) |
مورد
|
جزئیات
|
انواع نویسه های قابل تشخیص
|
ژاپنی:
نویسه های الفبایی عددی، نویسه های کانا، نویسه های کانجی (JIS سطح اول و تعدادی JIS سطح دوم)، نمادها چینی (ساده شده):
نویسه های الفبایی عددی، نویسه های چینی، نمادها (GB2312-80) چینی (سنتی):
نویسه های الفبایی عددی، نویسه های چینی، نمادها (Big5) کره ای:
نویسه های الفبایی عددی، نویسه های چینی، نویسه های هانگول، نمادها (KSC5601) |
قلم های قابل تشخیص
|
چندین قلم پشتیبانی می شود. (نوع مینگ-چو توصیه می شود.)
نویسه های ایتالیایی قابل تشخیص نیست.
|
قلم های مورد استفاده برای نویسه های تبدیل شده (تنها زمانی که Word به عنوان فرمت فایل انتخاب شود)
|
ژاپنی:
نویسه های آسیایی: MS Mincho نویسه های اروپایی: Century چینی (ساده شده):
نویسه های آسیایی: SimSun نویسه های اروپایی: Calibri چینی (سنتی):
نویسه های آسیایی: PMingLiU نویسه های اروپایی: Calibri |
مورد
|
جزئیات
|
انواع نویسه های قابل تشخیص
|
نویسه های الفبایی عددی، نویسه های خاص زبان تشخیص داده شده*، نمادها
|
قلم های قابل تشخیص
|
چندین قلم پشتیبانی می شود. (Times، Century و Arial توصیه می شوند.)
نویسه های کج قابل تشخیص است.
|
قلم های مورد استفاده برای نویسه های تبدیل شده (تنها زمانی که Word به عنوان فرمت فایل انتخاب شود)
|
Calibri
سبک مورب بازتولید نمی شود.
|
مورد
|
جزئیات
|
فرمت سند اصلی
|
اسناد چاپی، اسناد پردازشگر Word (اسناد حاوی متن، گرافیک، عکس یا جدول و بدون نویسه کچ)
|
فرمت متنی
|
نوشته های افقی و عمودی (اسناد حاوی نوشته های افقی و عمودی نیز قابل تشخیص هستند)
برای زبان های اروپایی و متن کره ای، تنها نوشته های افقی قابل تشخیص است.
اسناد یک تا سه ستونی بدون تنظیمات پیچیده ستون
|
اندازه نویسه
|
8 تا 40 نقطه
|
فرمت جدول (فقط برای فرمت Word)
|
جدول هایی که با شرایط زیر مطابقت دارند:
جدول های حاوی مربع هایی که با خطوط تقسیم شده اند
جدول های دارای حداکثر 32 ستون
جدول های دارای حداکثر 32 ردیف
|
|
برخی اسناد اصلی مناسب برای پردازش OCR ممکن است به درستی پردازش نشوند.با اسناد اصلی که شامل مقدار زیادی متن در هر صفحه می باشند، ممکن است دقت بالایی به دست نیاید.
ممکن است به دلیل رنگ پس زمینه سند اصلی، فرم و اندازه نویسه ها یا نویسه های کج، نویسه ها با نویسه های ناخواسته جایگزین شوند یا جا بیفتند.*
ممکن است پاراگراف ها، شکست های خط یا جدول ها بازتولید نشوند.*
ممکن است برخی از بخش های تصاویر، عکس ها یا چاپ های مهری به عنوان نویسه تشخیص داده شوند و با نویسه ها جایگزین شوند.*
* وقتی Word به عنوان فرمت فایل انتخاب شود.
|