2024.03.28 (목)

  • 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공
상세검색
닫기

‘한글공학’은 무엇인가?

[공학박사의 한글 이야기 18]

[우리문화신문=신부용 전 KAIST 교수]  전번 이야기에서 ‘한글20’은 기본자음과 기본모음이 각각 10개씩이라 이들에게 수치 기호를 붙여 한글문서를 간단히 수치화할 수 있고 이는 곧 인간의 말소리를 수치화하는 것이라 했습니다. 소리를 수치화하는 것은 녹음기의 핵심기술입니다. 따라서 한글20은 녹음기에 비교되는 고도의 기술이라 하겠습니다.

 

사실 ‘한글20’은 녹음기보다 한 차원 높은 기술이라 할 수 있습니다. 왜냐하면 녹음기는 소리의 저장과 재생이 기술 전부지만, 한글20은 아래 그림에서 보는 것과 같이 문서화 기술까지 포함하기 때문입니다. 요컨대 한글20은 엄청난 기술적 가능성을 가졌으며 이러한 기술을 연구개발할 필요가 있다고 생각했습니다. 글쓴이는 이 분야를 한글공학이라 이름하고 2010년 KAIST에 한글공학연구소를 만들어 5년 동안 연구를 수행한 바 있습니다.

 

 

 

한글공학의 범위

 

한글공학의 범위는 한글공학연구소의 첫 과제에서 그 윤곽을 살펴볼 수 있습니다. 과제의 목적은 ‘시각장애인이 사용할 수 있는 만국어 컴퓨터 문자입력시스템’을 개발하는 것이었습니다. 언뜻 듣기에 실현이 가능한 과제가 아닌 것 같습니다. 어떻게 만국어를 입력하는 자판을 만들어 낼 것이며 거기에다 시각장애인까지 쓸 수 있게 하겠습니까? 더구나 촉각을 이용하는 방법은 애초에 연구 대상에서 제외되었습니다.

 

시각장애인을 우선하는 연구임에도 촉각을 배제한 것은 일반인과 함께 쓰기 위함이었습니다. 이는 촉각에 의지하는 점자가 오히려 시각장애인과 정상인을 격리하는 역작용을 한다는 것이 글쓴이의 주장이기 때문이었습니다. 점자의 역작용에 대해서는 나중에 해결 대안을 제시하겠습니다.

 

이 과제가 풀어야 할 기술을 다시 정리하면 다음과 같습니다.

 

1. 어떤 언어라도 입력할 수 있는 문자 입력시스템 개발

2. 자판을 보지 않고 입력할 수 있어야 함. 단 촉각 이용은 배제

3. 출력은 해당 언어의 철자법에 맞도록 해야 함

 

1번 과제, 곧 세상의 모든 언어를 그들 고유의 문자로 입력한다는 것은 기술적으로 거의 불가능할 것입니다. 결국 글자 대신 말소리를 통해 입력해야 할 터인데 소리를 직접 입력하는 것은 연구목적에서 배제되어 말소리를 글자로 표기하여 입력하도록 하였습니다. 국제음성기호(IPA)는 세상 모든 언어의 말소리를 글자와 기호로 표기해 주지만 140여 개에 달하는 글자와 40개가 넘는 부호를 수용할 자판을 만드는 것 역시 거의 불가능할 것입니다. 다행히 ‘한글20’은 어떤 언어라도 발음을 표기할 수 있으므로 ‘한글20’을 위한 자판을 만들면 해결될 일입니다.

 

2번 과제, 곧 시각장애인이 촉각을 사용하지 않고 입력하는 자판은 이미 존재합니다. 곧 자판의 글자 단추가 고유의 소리를 내도록 하여 그 소리를 듣고 선택하는 것입니다. 예를 들어 ‘가’를 입력하려면 ‘ㄱ’ 소리를 내는 글자단추와 ‘ㅏ’ 소리 나는 단추를 찾아서 누르면 됩니다. 그러나 이러한 기술은 쿼티 자판에서는 가능할 수 있지만 손말틀(휴대전화) 자판에서는 하나의 글자 단추가 여러 개의 소리를 내야 해서 구현하기 어렵습니다.

 

우리 과제는 슬기말틀(스마트폰)을 사용하되 쿼티자판은 글자 단추가 너무 작아져 고려하지 않았습니다. 해결 대안으로 ‘한글20’을 위한 자판을 새로 개발하여 사용하기로 했습니다. 아래 그림1은 그 얼개를 보여 줍니다. 10개의 자음단추에 기본자음을 배치하고 모음단추는 천지인의 3개 단추를 5개로 늘려 합자가 빠르도록 배치한 것입니다. 모음을 실제로 표기하듯 순서대로 천지인을 누르면 됩니다.

 

 

3번 작업을 수행하기 위해 위 그림2에 보인 다언어 DB (이 경우 5개 언어)를 내장하도록 하였습니다. 이 DB의 각 셀(cell) 윗줄은 해당 언어들의 철자법이고 아랫줄은 발음의 한글 표기입니다. 해당 언어의 발음을 한글로 표기하여 입력하면 이 DB에서 같은 한글표기의 낱말(어휘)을 찾아 그 위에 있는 철자법을 출력하여 보이게 됩니다. 예를 들어 ‘쉬에ᄰᅥᆼ’ 이라는 입력이 들어오면 가장 가까운 발음을 찾고 그 위에 있는 学生을 출력해 보입니다. 이 기술은 앞으로 좀 더 자세히 설명토록 하겠습니다.

 

아래 그림은 과제가 끝나 시각장애인이 시연하는 모습을 보입니다. 옆에 서 있는 연구원이 입력하는 내용을 화면에 중계하고 있습니다. 이 시연으로 연구목적이 기술적으로 실현할 수 있음을 입증하였습니다. 그러나 아직 상용화하지 못하고 있습니다.

 

다음번에는 한글공학을 보급하기 위한 전략에 대해 생각해 보겠습니다.