2024.03.02 (토)

  • 흐림동두천 2.7℃
  • 구름많음강릉 3.5℃
  • 구름조금서울 3.4℃
  • 맑음대전 2.1℃
  • 맑음대구 5.6℃
  • 맑음울산 4.1℃
  • 맑음광주 3.9℃
  • 맑음부산 3.5℃
  • 맑음고창 3.7℃
  • 흐림제주 5.8℃
  • 구름많음강화 3.8℃
  • 맑음보은 1.7℃
  • 맑음금산 1.9℃
  • 맑음강진군 4.7℃
  • 맑음경주시 4.5℃
  • 맑음거제 2.9℃
기상청 제공
상세검색
닫기

잔치 그리고 행사

한국어 잘하는 K-챗지피티, 한국어 저자원 언어 기반

국립국어원 한국어-외국어 병렬 말뭉치 구축 사업단 국제 토론회 열어

[우리문화신문=김영조 기자]  지난 5년(2018~2022) 동안 연평균 220만여 명의 외국인이 한국에 체류했다. 이를 국적별로 살펴보면 중국, 베트남, 태국, 미국, 우즈베키스탄, 필리핀, 일본 순이다.(법무부 출입국 통계 참조) 국경과 국적의 경계가 허물어지고 있음을 대한민국에서도 확인할 수 있다. 그러나 그만큼 한국에서 접할 수 있는 언어가 다양해졌는지는 의문이다. 영어, 중국어, 일본어 말고도 베트남어, 태국어, 우즈베크어 등은 일상에서 접하기도 쉽지 않고 자료를 구하기도 쉽지 않다. 이들 나라와 문화 및 산업 분야의 교류가 확대되는 상황까지 고려하면 언어 자원의 다변화는 필수적이다.

 

이에 국립국어원은 언어 자원의 불균형을 해소하고 관련 산업의 부가 값어치를 높이고자 2021년부터 8개 언어(베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아 크메르어, 필리핀 타갈로그어, 러시아어, 우즈베크어)를 대상으로 한국어-외국어 병렬 말뭉치 사업을 추진하고 있으며 올해까지 약 3,000만 어절의 병렬 말뭉치 구축을 목표로 하고 있다.

 

이 가운데서 2021년 사업에서 구축한 한국어-외국어 병렬 말뭉치는 연구와 기술 개발의 기초 자료로 누구나 활용할 수 있도록 ‘모두의 말뭉치(https://corpus.korean.go.kr)’를 통해 공개하였으며 이를 연구와 사업에 활용한 사례도 속속 등장하고 있다. 그 성과를 확인할 수 있는 국제 토론회가 오는 12월 8일(금) 아침 9시, 대한상공회의소 의원회의실에서 열린다.

 

 

‘국립국어원 한국어-외국어 병렬 말뭉치의 활용과 응용’을 주제로 열리는 이번 심포지엄은 국립국어원(원장 장소원)이 주관하고 ‘2023 한국어-외국어 병렬 말뭉치 구축 사업단’이 주최한다.

 

장소원 국립국어원장의 개회사로 시작하는 이번 심포지엄에서는 말뭉치 관련 산학 전문가들의 강연이 이어질 예정이다. 학계에서는 박진호 서울대 교수가 ‘한중 병렬 말뭉치를 이용한 대조문법 연구 시론: 중국어의 대응 표현이 한국어에 대해 시사하는 바를 찾아서’를 주제로, 이도길 고려대 교수가 ‘한국어 말뭉치 용례 검색기의 개발과 활용’을 주제로 발표하며 산업계에서는 이정수 ㈜플리토 대표가 ‘21년 한-외 병렬 말뭉치 사업 데이터를 활용한 LLM 성능 향상’을 주제로, 김윤기 ㈜업스테이지 엔지니어가 ‘업스테이지의 LLM Data 활용 사례’를 주제로 발표를 진행한다.

 

산학 전문가들이 함께하는 패널 토의에서는 한국어-외국어 병렬 말뭉치 구축 사업단 연구책임자 이정희 경희대 교수, 김일환 성신여대 교수, 이정수 ㈜플리토 대표, 김영택 ㈜솔트룩스파트너스 대표, 김유석 ㈜시스트란 대표가 한국어-외국어 병렬 말뭉치의 활용과 응용 방안에 대해 논의한다.

 

또한 이번 토론회에서는 다양한 언어권의 연구자들이 한국어-외국어 병렬 말뭉치 사업 데이터를 활용한 연구 사례를 발표한다. 카첸 딴시리(Kachen Tansiri) 태국 쭐랄롱꼰대 시린톤태국어연구소 이사와 박경은 한국외대 교수가 ‘Linguistic Insights: Unveiling and Addressing Common Errors in Korean-Thai Translations – A Guided Approach to Post-editing Excellence’를 주제로, 꾸마르 스리잔(Kumar Srijan) 부산외대 교수와 뒤웨디 아난드 쁘라까쉬 샤르마(Dwivedi Anand Prakash Sharma) 델리대 교수가 ‘고유명사 음역 기준의 중요성 및 한계점: 한국어-힌디어 병렬 말뭉치 번역에 나타난 고유명사 음역을 중심으로’를 주제로 발표를 진행한다.

 

이어 갈라노바 딜노자(Kalanova Dilnoza) 호남대 교수가 ‘병렬 말뭉치를 활용한 한국어-우즈베크어 번역 양상 연구: 고유명사를 중심으로’를 주제로, 모졸 따지아나(Mozol Tatiana) 모스크바국립외대 교수와 마블레에바 다리아(Mavleeva Darya) 모스크바국립외대 교수가 ‘Discourse Markers of Korean and Russian Languages as Means of Mitigation’을 주제로 발표하며 알드린 리(Aldrin P. Lee) 필리핀국립대 교수가 ‘A Typology of Translation Errors in the Korean-Tagalog Parallel Corpus’를 주제로 발표한다.

 

국립국어원은 이번 토론회를 바탕으로 저자원 언어의 병렬 말뭉치 구축을 확대하고 국제적인 언어 연구 협력을 증진하는 한편 다양한 언어 간 협력의 다리를 만들어 나가기 위한 노력을 지속할 계획이다. 한편 이번 토론회는 유튜브를 통해 실시간 온라인으로 내보낼 예정이다.