[우리문화신문=김영조 기자] 지능형 데이터 전문 기업 (주)누리아이디티(대표 배성진)는 5월 12일 고문헌 한문을 현대 한국어로 옮겨 주는 <고문헌 자동 번역> 프로그램을 국내 기업 처음으로 개발해 공개했다. 인공지능(AI) 모델 기반의 이 프로그램은 전통 고문헌의 옛 한문을 글자로 입력하면 원문 1,000자까지 1초 이내에 한글로 자동 번역하여 출력해 준다. 이 자동 번역 프로그램을 이용하면 대부분 원문 형태로 산적해 있는 수많은 고문헌 콘텐츠를 전문 연구자는 물론 일반인도 손쉽게 이해하고 활용할 수가 있다. 일반인도 고문헌 콘텐츠에 접근할 수 있는 길 열어 최근 인공지능 기술의 발달에 힘입어 기계를 사용해 한 언어를 다른 언어로 자동 번역하는 기술도 주목할 만한 수준에 도달해 있다. 네이버 파파고, 구글 번역기 등 첨단 대기업들이 제공하는 자동 번역 서비스는 사용자들이 실생활에서 외국어 글자를 이해하는 데 큰 도움을 주고 있다. 하지만 이러한 지구촌 자동 번역 서비스는 영어, 중국어, 일본어 등 수요가 많은 현대의 주요 언어 간 번역 부문에 주력하고 있어, 전통 고문헌의 옛 한문과 같이 특수한 부문의 경우에는 간편한 사용과 양호한 번역 품질을
[우리문화신문=김영조 기자] 지능형 데이터 전문기업 ㈜누리아이디티(대표 배성진)는 6월 1일 인공지능 기반의 고문헌 한자 문자인식(OCR) 서비스를 출시했다. 누리IDT가 한문 고문헌 자료의 토털 솔루션으로 개발하고 있는 <고문헌한자시스템>의 대표 서비스로 개발하여 출시한 <고문헌 한자 OCR 서비스>는 우리나라의 고문헌 자료에 특화된 고성능 한자 자동인식 모델이다. 사용법은 간단해서, 화면의 원문 이미지 입력 창에 원문 한 면(JPG, PNG 포맷)씩을 올리면 인공지능(AI)이 이미지 속의 글자를 자동인식하고 곧바로 한자 텍스트로 출력해 준다. 인공지능 기반 평균 인식률 98%의 고성능 <고문헌 한자 OCR 서비스> 이 서비스의 개발 과정에서 인공지능 모델은 형태와 크기가 다양한 고문헌 속 한자를 3,000만 자 이상 학습하였다. 그 결과 일반적인 고문헌 형태, 곧 가장 많이 쓰이는 해서체나 행서체 글자에 세로쓰기로 제작된 목판본 자료에 대해서는 95~100%(평균 98%)란 높은 인식률을 구현하고 있다. 또한 손글씨로 작성된 필사본의 경우에도 전문가도 판독하기 어려운 초서 자료가 아니라면 상당한 수준의 인식률을 보이고 있다