게시판 뷰
게시판 뷰페이지
“한자 자형(字形) 디지털 사전, AI가 맡는다” 한국학사전편찬 사업 선정
분류 이슈
작성자 홍보팀 가지혜
날짜 2019.11.19
조회수 3,126
썸네일 /thumbnail.58285.jpg

AI(인공지능) 기반 한자 자형 인식·분류 자동화 플랫폼 구축 목표…3년간 10.5억 지원
한국학중앙연구원 사업 선정, 한문교육연구소·자율형블록체인연구소·동양학연구원 공동연구 진행

동양학연구와 인공지능(AI)이 만난다. 세계 최대 규모 「한한대사전」(漢韓大辭典, 16권) 완간,「한국한자어사전」완간 및 네이버 한자 검색 서비스 개시,「한국고유한자자전」편찬 등 동양학연구 부흥을 위해 남다른 집념과 철학으로 연구에 매진해온 우리 대학이 한국학중앙연구원의 한국학사전편찬 지원사업에 선정되는 결실을 맺었다.


▲ AI(인공지능) 기반 ‘한자 자형(字形) 디지털 사전’ 구축 사업을 주도하는 (왼쪽부터) 김문식 원장, 김우정 소장, 박용범 소장

지난 6월 한문교육연구소(소장 김우정)가 ‘한국학사전편찬사업’(한국학중앙연구원 주관)에 선정돼 3년간 최대 10억 5천만원을 지원받는 것. 사업단은 동양학연구원(원장 김문식) 및 자율형블록체인연구소(소장 박용범)와 유기적으로 협력해 AI(인공지능)를 기반으로 한자 자형(字形) 디지털 사전 구축에 박차를 가한다. 죽전캠퍼스 특성화 전략에 발맞춰 IT/SW와 CT를 기반으로 융합연구를 주도할 전망이다.

‘한자 자형(字型) 디지털 사전’은 음과 뜻은 같으나 모양이 다른 한자인 ‘이체자’를 수집·정리한다. 사업단은 한국 역대 문헌「조선왕조실록」,「승정원일기」,「일성록」등 574종에 수록된 다양한 한자 자형 및 자체 약 3억자를 수집, 「한국 한자 자형(字形) 사전」DB를 구축한다. 또한 인공지능 알고리즘과 빅데이터 학습을 통해 한자를 자동 인식‧분류하는 자동화 플랫폼도 구축할 예정이다.


▲ 한국학중앙연구원「한국학사전편찬사업」에 선정된 사업단 단체 사진

플랫폼은 한자 자형만 나열하는 수준을 넘어 △ 한자 검색 △ 총획 검색 △ 부수 검색 △ 음가 검색 △ 부건 검색 △ 코드값 검색 등 다양한 속성 정보도 제공한다. 플랫폼 구축을 위해 사업단은 ‘Mask-RCNN’ (딥러닝을 통해 이미지 유사도를 측정하는 최신 기술)를 이용해 한자 자형의 유사도를 측정하고, 이를 바탕으로 DB를 구축한다.

김우정 소장은 “이번 사업은 1973부터 30여년 간 수많은 한학자와 310억 원에 달하는 막대한 자금을 투입해 완간한「한한대사전」,「한국한자어사전」의 성과를 잇고, 향후 본 사업의 결과물까지 통합하여 세계 유일의 웹기반 한자 종합 정보검색 시스템을 구축하기 위한 기반을 마련했다는데 큰 의미가 있다”며 “전통적인 인력 중심의 인문학 연구를 탈피하여 IT기술을 접목한 새로운 시도로, 국내외에 학제간 융복합연구의 모범적 사례로 주목받을 수 있도록 노력하고 있다”고 소감을 전했다.

사업단은 이번 사업 종료 이후 누구나 쉽고 편리하게 한자 정보를 검색할 수 있도록 한자 인식이 가능한 모바일 앱 등을 구축할 예정이다.