고서(古書) 속 한자를 자동 인식할 수 있는 '광학문자인식'(OCR) 시스템 개발사업이 성과를 내고 있다.
경북 안동에 있는 한국국학진흥원은 한국지능정보사회진흥원의 지원을 받아 ㈜누리 IDT, ㈜NHN다이퀘스트, ㈜에프아이솔루션과 함께 OCR 시스템 개발을 진행하고 있다고 5일 밝혔다.
1차년도 사업 결과, 세계기록유산인 유교책판 활자 등 고서의 한자 인식률 정확도를 80%까지 끌어올렸다.
우리나라 기록문화에 가장 많은 부분을 차지하는 고서에 대한 접근성을 높이기 위해서는 고서 내용을 디지털 문자로 치환해 검색과 활용도를 높여야 한다.
이 때문에 한자 해독이 가능한 전문가들이 주요 경전의 내용을 한 글자 한 글자 입력하면서 디지털화 작업을 진행하고 있지만, 수많은 고서 내용을 디지털 문자로 전환하는 일은 상당한 시간과 노력이 필요하다.
국학진흥원은 기존 DB구축 사업을 통해 확보된 이미지와 고해상도의 이미지 스캔을 해둔 결과물을 중심으로 다양한 글자들을 인공지능이 학습할 수 있는 OCR 시스템을 개발하고 있다.
정종섭 한국국학진흥원장은 "산적한 고서들을 활용하기 위한 첫 단계가 디지털화 작업인데, 이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다"며 "향후 이미지 인식률을 높일 수 있는 사업을 계속 추진할 것"이라 말했다.
댓글 많은 뉴스
이재명 90% 득표율에 "완전히 이재명당 전락" 국힘 맹비난
권영세 "이재명 압도적 득표율, 독재국가 선거 떠올라"
이재명 "TK 2차전지·바이오 육성…신공항·울릉공항 조속 추진"
이재명, 민주당 충청 경선서 88.15%로 압승…김동연 2위
전광훈 "대선 출마하겠다"…서울 도심 곳곳은 '윤 어게인'