OCR(텍스트 검색 가능)이 부적절하게 수행되는 경우

여기서는 검색 가능한 PDF/XPS/OOXML 파일을 만들 때 OCR(텍스트 검색 가능) 기능이 작동하는 방식과 OCR(텍스트 검색 가능) 기능에 적합한 파일 형식에 대해 설명합니다.
올바른 OCR(문자 인식) 결과를 얻을 수 없는 경우 다음 지침을 참고하십시오.

OCR(문자 인식)

OCR로 처리할 수 있는 문자가 아래의 표에 나열되어 있습니다. OCR 처리가 올바르게 작동하지 않으면 문자 종류를 확인하십시오.
중요
원고에 사용된 언어에 따라 OCR을 수행하더라도 원고의 텍스트 및 파일 형식에 따라 올바른 결과를 얻지 못할 수도 있습니다.
항목
파일 형식
PDF/XPS/PowerPoint
Word
인식 언어
문자는 [환경 설정](설정/등록)의 [표시언어/키보드 전환]에서 선택한 언어에 따라 다음 언어 또는 언어 그룹 중 하나로 인식됩니다.*1 *2
[변경]을 눌러 다음 언어나 언어 그룹에서 원고에서 사용되는 언어를 선택합니다. 선택한 언어에 따라 문자가 인식됩니다.
아시아 언어
다음 언어의 문자가 인식됩니다.
일본어, 중국어(간체), 중국어(번체), 한국어
유럽 언어
다음 언어 또는 언어 그룹의 텍스트가 인식됩니다.
언어
영어, 프랑스어, 이탈리아어, 독일어, 스페인어, 네덜란드어, 포르투갈어, 알바니아어, 카탈로니아어, 덴마크어, 핀란드어, 노르웨이어, 스웨덴어, 크로아티아어, 체코어, 헝가리어, 폴란드어, 슬로바키아어, 에스토니아어, 라트비아어, 리투아니아어, 러시아어, 그리스어, 터키어
언어 그룹
서유럽어(ISO), 중앙 유럽어(ISO), 발트어(ISO)*3
아시아 언어의 문자 인식
인식 문자 유형
일본어: 영숫자 문자, Kana 문자, Kanji 문자(JIS first level, JIS second level(부분적)), 기호
중국어(간체): 영숫자 문자, 한자, 기호(GB2312-80)
중국어(번체): 영숫자 문자, 한자, 기호(Big5)
한국어: 영숫자 문자, Kanji 문자, 한글 문자, 기호(KSC5601)
인식 폰트
다중 폰트 지원(Ming-cho 형식 권장)
기울임꼴은 인식 불가능
변환된 폰트
-
일본어가 선택된 경우:
아시아 문자: MS Mincho
유럽 문자: Century
중국어(간체)가 선택된 경우:
아시아 문자: SimSun
유럽 문자: Calibri
중국어(번체)가 선택된 경우:
아시아 문자: PMingLiU
유럽 문자: Calibri
유럽 언어 문자 인식
인식 문자 유형
영숫자 문자, 인식된 언어의 특수 문자*4, 기호
인식 폰트
다중 폰트 지원(Times, Century 및 Arial 권장)
기울임꼴 인식 가능
변환된 폰트
-
Calibli로 표시됨
기울임꼴은 변환 불가능
*1 [환경 설정](설정/등록)의 [표시언어/키보드 전환]에서 언어 리스트에 표시되는 언어가 다를 수 있습니다.
*2 [환경 설정](설정/등록)의 [표시언어/키보드 전환]에서 영어, 프랑스어, 이탈리아어, 독일어, 스페인어, 태국어 또는 베트남어를 선택할 경우 해당 언어가 서유럽어(ISO)로 인식됩니다.
*3 각 언어 그룹은 다음 언어로 구성됩니다. 언어 그룹을 선택하면 언어 그룹의 언어로 작성된 텍스트가 인식됩니다.
서유럽어(ISO):
영어, 프랑스어, 이탈리아어, 독일어, 스페인어, 네덜란드어, 포르투갈어, 알바니아어, 카탈로니아어, 덴마크어, 핀란드어, 아이슬란드어, 노르웨이어, 스웨덴어
중앙 유럽어(ISO):
크로아티아어, 체코어, 헝가리어, 폴란드어, 슬로바키아어
발트어(ISO):
에스토니아어, 라트비아어, 리투아니아어
*4 그리스어를 선택하면 다음 특수 문자를 인식할 수 있습니다. 다른 언어를 선택할 경우 각 언어별 특수 문자를 인식할 수 있습니다. 언어에 따라 일부 특수 문자를 인식하지 못할 수도 있습니다.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

원고 형식

OCR에 적합한 파일 형식을 사용하여 OCR 결과의 정확도를 향상시킬 수 있습니다.
올바른 OCR 결과를 얻을 수 없으면 스캔한 원고의 파일 형식이 OCR에 적합한지 확인하십시오.
중요
페이지별 텍스트의 양이 많은 원고를 사용하는 경우 OCR이 올바르게 수행되지 않을 수도 있습니다.
Word 형식을 선택한 경우, 권장 파일 형식으로 원고를 사용하더라도 OCR이 제대로 실행되지 않을 수 있습니다.
배경 색상, 문자 스타일, 문자 크기 및 문자 기울기에 따라 일부 문자가 잘못 대체되거나 OCR 결과에서 누락될 수 있습니다.
원고의 단락, 구분선 및 표가 인식되지 않을 수도 있습니다.
이미지의 일부가 인식되지 않고 문자로 대체될 수 있습니다.
항목
상세 정보
원고 형태
인쇄된 문서, 텍스트 문서(기울어진 문자 없이, 텍스트, 그림, 이미지, 표로 구성된 문서)
텍스트 형식
가로형, 세로형
가로 및 세로 배열을 둘 다 포함하는 문서를 인식할 수 있습니다.
유럽어와 한국어의 경우에는 가로형만 인식할 수 있습니다.
복잡한 열이 없는 문서
문자 크기
8 ~ 40 포인트
표 형식
(Word 문서만 해당)
다음 조건을 충족하는 표
실선이 있는 사각 표
행 수가 32개 이하
열 수가 32개 이하
12KH-0JW