조글로로고
음성인식 어려운 우리말… 세종대왕은 왜 ‘쌍리을’ 안 만들었을까
조글로미디어(ZOGLO) 2017년5월27일 12시47분    조회:2649
조글로 위챗(微信)전용 전화번호 15567604088을 귀하의 핸드폰에 저장하시면
조글로의 모든 뉴스와 정보를 무료로 받아보고 친구들과 모멘트(朋友圈)로 공유할수 있습니다.
['AI 4총사' 써 봤더니...] 수많은 예외적 발음, 디지털 음성인식 난제


#1
L-R에 뜻 구별되는 영어와 달리
‘ㄹ’ 발음 따라 의미 다른 한국어 없어
굳이 쌍리을 만들지 않았던 것
#2
“들리는 대로 사전 찾으면 없어”
외국인들 어려워하는 발음 규칙
AI도 곤란해하긴 마찬가지

한국인은 영어 L 소리와 R 소리를 분명히 구분해 인식하고 발음하지만 한글은 이를 구분하지 않고 ‘ㄹ’ 하나로 표기한다. 세종대왕이 훈민정음을 창제하면서 각각의 소리를 나타내는 글자를 따로 만들지 않은 이유는 무엇일까. 한국일보 자료사진

미국 여행 중 옷을 한 벌 사러 쇼핑센터에 들른 정모(44)씨는 점원에게 “라지 사이즈”를 달라고 말했다가 말이 안 통해 당황했다. 그래도 대학을 졸업했는데 ‘라지(Large)’에서 막히다니? 정씨는 그러나 곧 자신이 ‘Rarge’에 가깝게 발음했다는 사실을 알아차렸다. 한국인이 L 소리와 R 소리를 구분하지 못하는 것은 아니다. 명확히 구분하고 발음할 줄 알지만, 한국 말에서 L 소리는 받침(종성)에서만, R에 가까운 소리는 초성에서만 나기 때문에 무의식 중에 두 발음을 혼동하는 것이다. 

리을 발음의 저 복잡다양함

만약 세종대왕이 ‘나랏말씀이 영국과 다를 백성마저 딱하게 여겨” 한글 창제시 L 소리를 표현할 글자를 하나 더 만드셨다면 어땠을까. 가령 ‘ㄹ’에 가획한 어떤 글자나 쌍리을(ㄹㄹ) 같은 것으로 L 소리를 표기했다면? ‘Large’를 ‘ㄹ라지’로 쓴다면 정씨처럼 무의식적으로 R 발음을 하는 실수는 줄지 않았을까. Hotel을 ‘호텔ㄹ’로 쓰고, Paper는 ‘페이펄’로 쓴다면 종성의 L과 R을 정확히 발음하는 데에도 도움이 되지 않을까. 그러나 안타깝게도 세종대왕은 쌍리을을 만들지 않으셨다. 수백년 전 컴퓨터 키보드와 휴대폰 문자판을 예상하고 한글을 만드셨다는 (소문이 있는) 세종대왕이, 도대체, 왜? 

한글은 표음문자다. 28자만으로 매우 다양한 소리를 표기할 수 있다고 알려져 있다. 하지만 실상 우리나라 말은 표기와 발음 사이의 괴리가 매우 크다. ‘ㄹ’만 놓고 얼마나 다양한 발음이 나는지 보자. 우선 ‘ㄴ’ 받침 뒤에 ‘ㄹ’이 올 경우 두 가지 발음규칙이 있다. ‘난로[날로]’처럼 ‘ㄹ-ㄹ’로 발음하는 유음화와, ‘생산량[생산냥]’처럼 ‘ㄴ-ㄴ’으로 발음하는 비음화다. 받침 ‘ㄹ’ 뒤에 ‘ㅂ, ㄷ, ㅅ, ㅈ, ㄱ’가 이어질 때에는 ‘물고기[물꼬기]’처럼 된소리로 바뀔 때도 있고, ‘불고기[불고기]’처럼 안 바뀔 때도 있는데 어떤 경우에 된소리가 되는지 규칙이 없다. 한국어 음성학 전공인 김종덕 박사(전 도쿄외대 부교수)는 “‘ㄹ’ 뒤에 ‘ㅅ’이 오는 경우 90% 정도가 된소리로 발음한다는 경향은 있지만, 어떤 조건에서 된소리가 나는지 규칙을 찾기 어렵고 사전을 통해 확인하는 수밖에 없다”며 “한국어에서 가장 발음법칙이 복잡하고 어려운 글자가 리을”이라고 말한다. 

이것이 끝이라면 좋겠다. 벌써 머리가 아프면 이 단락은 읽지 말고 건너뛰자. ‘서울역[서울력]’, ‘알약[알략]’처럼 ‘ㄹ’ 뒤에 모음이 이어지는 단어에서 ‘ㄴ’이 첨가돼 다시 ‘ㄹ’로 발음이 바뀌는 경우도 있는데 이 역시 규칙을 찾기 어렵다. 예외 없이 적용되는 보편 발음규칙도 있는데 ▦‘칼날[칼랄]’ ‘달나라[달라라]’처럼 늘 ‘ㄹ-ㄹ’로 발음(받침 ‘ㄹ’ 뒤에 초성 ‘ㄴ’이 올 경우)하거나 ▦’심리[심니]’ ‘종로[종노]’처럼 ‘ㄹ’을 늘 ‘ㄴ’으로 발음하거나(‘ㅁ, ㅇ’ 받침 뒤에서) ▦‘합리[함니]’ ‘석류[성뉴]’처럼 받침과 ‘ㄹ’이 함께 비음(‘ㅁ-ㄴ’, ‘ㅇ-ㄴ’)으로 바뀌는 경우(‘ㅂ, ㄷ, ㅅ, ㅈ, ㄱ’ 받침 뒤에서)가 그렇다. 

발음대로 쓰지 않는 한국어

이쯤 되면 단지 한글에 쌍리을 없는 게 문제가 아닌 것 같다. 한국어가 과연 표음문자가 맞기나 한 건지 의심스럽다. 아이나 외국인이 처음 한글을 배울 때 어려운 점이 이 대목이다. 연세대 국어국문학과에서 석사과정을 밟고 있는 중국인 학생 쥐이신(鞠鑫)씨는 “처음 한국어를 배울 때 받아쓰기 시험을 치면 늘 틀렸다. 발음 나는 대로 쓰면 맞춤법에 맞지 않았다”고 말한다. 듣기만 해서는 모르는 단어를 사전에서 찾기도 쉽지 않았다고 그는 덧붙인다. “한국인과 대화를 하거나 드라마를 볼 때 모르는 단어가 들리면 사전을 찾고 싶은데 받침으로 뭘 쓰는지를 알 수가 없어요. 예를 들어 ‘혁명’이라는 단어를 찾아야 할 때 ‘형명’ ‘현명’ 등으로 들려서 이런 단어를 찾으면 사전에는 안 나오는 식이죠.” 그는 “특히 겹받침을 쓰는 단어가 가장 어렵다”고 말한다. 같은 과 석사과정 중인 일본 학생 니시오카 리나(西罔莉菜)씨도 같은 이유로 “사람 이름이나 지명처럼 처음 듣는 고유명사를 가장 알아듣기가 어렵다”고 말했다. 

연세대 국어국문학과 대학원을 다니는 외국인 유학생들은 “한글이 표음문자인데도 발음과 표기 사이의 차이가 상당해 배우기가 쉽지 않다”고 입을 모았다. 고영권기자 youngkoh@hankookilbo.com
일어와 비교하면 갑자기 한국어를 배운 게 억울하다고 느낄 수 있다. 일어에서 다리(橋)는 ‘하시’로 읽고 ‘はし’로 쓴다. 새 다리(新橋)는 ‘신바시’로 읽는데 표기 역시 발음 그대로 ‘しんばし’로 쓴다. 소리 나는 대로 쓰고 쓴 대로 읽으니 복잡한 발음법칙과 맞춤법 문제가 없다. 한국어에서도 ‘끄치’ ‘끈나다’ ‘끄테’처럼 소리 나는 대로 쓴다면 아이들은 쉽게 받아쓰기 100점을 맞을 것이다. 

바쁘면 이 단락도 건너뛰어도 된다. ‘끝이’ ‘끝나다’ ‘끝에’를 표기법에 맞다고 하는 것은 한국어가 형태소(의미를 가진 최소 단위)를 유지해 표기하는 원칙을 채택했기 때문이다. 그리고 그 뿌리는 음소 개념을 발견하고도 초성-중성-종성을 모아 한 음절로 표기하는 모아쓰기 원칙을 정립한 세종대왕으로 거슬러 올라간다. 일어는 음소글자가 아닌 음절글자(한 음절이 한 글자)여서 발음을 표기에 반영하기가 상대적으로 쉽다. 때문에 한글을 배우는 아이들은 받아쓰기 시험을 치르느라 힘들어졌지만, 대신 ‘끝나라’와 ‘끈나라’처럼 의미가 다른 단어들을 쉽게 구분할 수 있다. 

세종대왕, 알고도 만들지 않았다

앞의 질문으로 돌아가, 세종대왕은 왜 쌍리을을 만들지 않았을까. 전세계 언어학자들이 인정하는 천재적인 언어ㆍ음성학자였던 그가 음가를 구분 못해 ‘ㄹ’ 한 자에 만족했다고 보기는 어렵다. 세종대왕을 깎아내리고 싶어도 그럴 가능성은 희박하다. 현대 국어학자들이 내놓는 답은 “’ㄹ’의 음가가 둘 이상이라는 것을 세종대왕이 몰라서가 아니라, 필요가 없었기 때문에 추가 글자를 만들지 않았다”는 것이다. 이 무슨 ‘세종대왕 무오류성 원칙’ 같은 소리란 말인가. 

‘ㄹ’ 하나만으로 충분한 이유는 우리나라 말 중에 R/L 소리에 따라 의미가 달라지는 단어가 없기 때문이다. 예를 들어 ‘발’과 ‘팔’은 ‘ㅂ-ㅍ’만 다른데 전혀 다른 의미의 단어가 된다. 그래서 한국어는 ‘ㅂ’과 ‘ㅍ’을 별개의 음소로 구분한다. 그러나 ‘ㄹ’의 경우 이처럼 L/R의 소리 차이로 의미가 구별되는 단어쌍이 전혀 없다. ‘ㄹ’은 한 글자로도 충분했던 것이다.

천재적인 언어학자였던 세종대왕은 음소의 개념을 바탕에 두고 한국어 음가를 체계적으로 분류해 훈민정음 28자를 만들었다. 세종대왕이 L 소리와 R 소리를 구분해 표기할 글자를 따로 만들지 않은 이유는 한국어에서 이를 구분할 필요가 없었기 때문이다. 한국일보 자료사진
음성인식의 최대 난제는 한국어

발음법칙이 복잡하고 예외도 많고 규칙조차 없는 경우가 허다한 한국어의 현실은 최근 발전하는 디지털 음성인식에도 난제를 안긴다. 경계가 명확치 않은 ‘아’와 ‘어’ 소리를 구분하는 것부터 시작해, ‘성뉴’를 ‘석류’로 이해하고, ‘소주’ ‘쏘주’ ‘쐬주’ 등 다양한 발음을 알아듣는 것 모두 난관이다. 

발음만 문제가 아니다. 한국어는 동사의 어미 활용으로 시제, 존칭, 사동/피동 등을 표현하는 등 접사 활용으로 단어의 의미와 문법적 기능이 달라지는 몇 안 되는 언어다. 가령 ‘찾으셨으리라’는 단어를 듣고 동사의 뜻(찾다)과 높임(시), 시제(었), 추측(리라)을 모두 파악하는 것이 AI에겐 만만치 않은 과제다. 하물며 한국인 중에도 어른이 아닌 물건을 높여 말하는 이들이 허다함에랴. 강승식 국민대 소프트웨어융합대학 교수는 한국어 어휘를 기술적 난제로 꼽았다. 강 교수는 “‘노랗다’는 뜻의 영어 단어는 ‘Yellow’로 대표되지만, 한국어에는 ‘노랗다’ ‘누렇다’ ‘노르스름하다’ ‘누리끼리하다’ 등 무수히 많다 보니 AI가 이런 어휘를 다 인식하기가 힘들다”고 말했다. 

세종대왕은 쌍리을을 만들지 않았지만 그는 잘못이 없다. 기계와의 소통이 어렵다고 한국말을 탓할 필요도 없다. 어차피 나면서부터 한국말을 써온 이들끼리도 소통은 어렵고 오해는 쉽다. 

한국일보
Total : 1576
  •   천진시 조선족들의 우리 노래 자랑 모임   천진시 조선족 상회 하서구분회,동려구분회의 주최하에 지난 12월 5일 “천진시 조선족 제2차 우리 노래 자랑”이 제2문화궁에서 성황리에 개최되었다. 오전의 예심에 합격한 20명의 선수들이 유치원 어린이들로부터  80여세되는 할머니에 이르는 800여...
  • 2015-12-10
  • 레오나르도 다빈치의 '모나리자' 밑에 숨겨진 또 다른 초상화가 있다는 주장이 제기됐다.   영국 BBC는 8일(현지시간) 프랑스 예술작품 분석가 파스칼 코테가 층간증폭법(Layer Amplification Method)을 활용해 모나리자를 10년간 분석한 뒤 이처럼 주장했다고 보도했다.   층간증폭법은 반사광 기술을 ...
  • 2015-12-10
  • 지난 9월 20일 백리성쇼핑중심의 개업과 함께 쇼핑센터의 지하 1층과 지상 6층, 7층의 미식성도 고객들의 눈길을 끌기 시작했다. 예전의 백화상가나 쇼핑센터 안에 위치한 미식성은 쇼핑하러 간 사람들이 간단히 끼니를 때우는 곳으로만 간주되였지만 백리성미식성은 맛집천지인 연길에서 또 하나의 “맛동네”로...
  • 2015-12-10
  • [앵커] 낮엔 관광지, 밤엔 무법천지 한국인데 전혀 한국 같지 않은 동네 이런 수식어하면 떠오르는 곳 중에 하나가 바로 영등포에 있는 대림동입니다. 국내 최대 중국인 거주지이기도 하죠. 하지만 최근엔 자정 노력들이 이뤄지면서 범죄율도 뚝 떨어지고 예전과는 사뭇 달라졌다고 하는데요. 연말연시를 맞은 대림동의 모습...
  • 2015-12-09
  •           조선족 그릇선물세트.        (흑룡강신문=하얼빈)국가관광국에서 거행한 "제1기 중국특생관광상품 평선활동"이 일전에 결과를 공개했다. 길림성관광국에서 선택해 올린 관광상품이 전국 10대류 만여건의 관광상품중 두각을 드러내 1금 3은의 좋은 성적을 획...
  • 2015-12-08
  •   (흑룡강신문=하얼빈) 지난 12월 2일부터 4일까지 사천성 성도에서 제3회 중국네트워크 방송대회가 열렸다. 개최 3회째를 맞는 이번 대회에는 중국 광전총국을 비롯하여 전 중국 방송통신 관계자 약 3000여명이 집결한 가운데 인터넷을 기반으로 하는 대영상 시대를 향하는 중국 전역의 뜨거운 열기가 차넘쳤다.    ...
  • 2015-12-07
  •         원제목:고궁박물관 문화창의 상품 인기        (흑룡강신문=하얼빈) 최근 고궁 박물관이 귀여운 디자인을 이용해 이목을 끄는데 다시 한번 성공하여 화제가 되었다. 기억속에 근엄한 역사 인물인 옹정제(雍正帝)와 오배(鰲拜) 등을 귀엽게 표현되고 유머러스한 숭정제(崇...
  • 2015-12-03
  •         중국조선민족사학회 “제20차 중국조선족포럼”열려   글로벌시대 ‘조선족기업 발전 전망’ 베이징서 개최   (흑룡강신문=하얼빈)이호남, 김동파 기자= 민족공동체의 확산과 더불어 지역사회에서의 조선족기업인들의 역할이 날로 강화되어가고 있는 것이 현실이다. ...
  • 2015-12-03
  • 중국에서 일본군 위안부를 주제로 한 기념관이 처음으로 개관했다. 2일 신화망(新華網)에 따르면 난징(南京)시 소재 리지샹(利濟巷) 위안소 유적지에서 전날 한중 양국 인사 300여명이 참석한 가운데 위안부 기념관 개관식을 거행했다. 총 3천㎡ 규모로 세워진 기념관의 외벽과 전시실에는 당시 위안부 피해자들이 겪었던 ...
  • 2015-12-03
  • 서울 11월 30일발 신화사소식: 11월 30일 "동북아명인회" 제10차회의에서는 《중일한 공용상용 808한자표》 신간 서적을 발표하여 명인회 10년 력사에서 가장 중요한 성과의 하나가 되였다. 한국 전 문화부장 리우녕은 신간 서적 발표식에서 "동북아시아명인호"가 이렇게 힘든 환경에서도 부단히 10년을 이어올수 있었던 가...
  • 2015-12-02
‹처음  이전 89 90 91 92 93 94 95 96 97 98 99 다음  맨뒤›
조글로홈 | 미디어 | 포럼 | CEO비즈 | 쉼터 | 문학 | 사이버박물관 | 광고문의
[조글로•潮歌网]조선족네트워크교류협회•조선족사이버박물관• 深圳潮歌网信息技术有限公司
网站:www.zoglo.net 电子邮件:zoglo718@sohu.com 公众号: zoglo_net
[粤ICP备2023080415号]
Copyright C 2005-2023 All Rights Reserved.