조글로로고
음성인식 어려운 우리말… 세종대왕은 왜 ‘쌍리을’ 안 만들었을까
조글로미디어(ZOGLO) 2017년5월27일 12시47분    조회:2573
조글로 위챗(微信)전용 전화번호 15567604088을 귀하의 핸드폰에 저장하시면
조글로의 모든 뉴스와 정보를 무료로 받아보고 친구들과 모멘트(朋友圈)로 공유할수 있습니다.
['AI 4총사' 써 봤더니...] 수많은 예외적 발음, 디지털 음성인식 난제


#1
L-R에 뜻 구별되는 영어와 달리
‘ㄹ’ 발음 따라 의미 다른 한국어 없어
굳이 쌍리을 만들지 않았던 것
#2
“들리는 대로 사전 찾으면 없어”
외국인들 어려워하는 발음 규칙
AI도 곤란해하긴 마찬가지

한국인은 영어 L 소리와 R 소리를 분명히 구분해 인식하고 발음하지만 한글은 이를 구분하지 않고 ‘ㄹ’ 하나로 표기한다. 세종대왕이 훈민정음을 창제하면서 각각의 소리를 나타내는 글자를 따로 만들지 않은 이유는 무엇일까. 한국일보 자료사진

미국 여행 중 옷을 한 벌 사러 쇼핑센터에 들른 정모(44)씨는 점원에게 “라지 사이즈”를 달라고 말했다가 말이 안 통해 당황했다. 그래도 대학을 졸업했는데 ‘라지(Large)’에서 막히다니? 정씨는 그러나 곧 자신이 ‘Rarge’에 가깝게 발음했다는 사실을 알아차렸다. 한국인이 L 소리와 R 소리를 구분하지 못하는 것은 아니다. 명확히 구분하고 발음할 줄 알지만, 한국 말에서 L 소리는 받침(종성)에서만, R에 가까운 소리는 초성에서만 나기 때문에 무의식 중에 두 발음을 혼동하는 것이다. 

리을 발음의 저 복잡다양함

만약 세종대왕이 ‘나랏말씀이 영국과 다를 백성마저 딱하게 여겨” 한글 창제시 L 소리를 표현할 글자를 하나 더 만드셨다면 어땠을까. 가령 ‘ㄹ’에 가획한 어떤 글자나 쌍리을(ㄹㄹ) 같은 것으로 L 소리를 표기했다면? ‘Large’를 ‘ㄹ라지’로 쓴다면 정씨처럼 무의식적으로 R 발음을 하는 실수는 줄지 않았을까. Hotel을 ‘호텔ㄹ’로 쓰고, Paper는 ‘페이펄’로 쓴다면 종성의 L과 R을 정확히 발음하는 데에도 도움이 되지 않을까. 그러나 안타깝게도 세종대왕은 쌍리을을 만들지 않으셨다. 수백년 전 컴퓨터 키보드와 휴대폰 문자판을 예상하고 한글을 만드셨다는 (소문이 있는) 세종대왕이, 도대체, 왜? 

한글은 표음문자다. 28자만으로 매우 다양한 소리를 표기할 수 있다고 알려져 있다. 하지만 실상 우리나라 말은 표기와 발음 사이의 괴리가 매우 크다. ‘ㄹ’만 놓고 얼마나 다양한 발음이 나는지 보자. 우선 ‘ㄴ’ 받침 뒤에 ‘ㄹ’이 올 경우 두 가지 발음규칙이 있다. ‘난로[날로]’처럼 ‘ㄹ-ㄹ’로 발음하는 유음화와, ‘생산량[생산냥]’처럼 ‘ㄴ-ㄴ’으로 발음하는 비음화다. 받침 ‘ㄹ’ 뒤에 ‘ㅂ, ㄷ, ㅅ, ㅈ, ㄱ’가 이어질 때에는 ‘물고기[물꼬기]’처럼 된소리로 바뀔 때도 있고, ‘불고기[불고기]’처럼 안 바뀔 때도 있는데 어떤 경우에 된소리가 되는지 규칙이 없다. 한국어 음성학 전공인 김종덕 박사(전 도쿄외대 부교수)는 “‘ㄹ’ 뒤에 ‘ㅅ’이 오는 경우 90% 정도가 된소리로 발음한다는 경향은 있지만, 어떤 조건에서 된소리가 나는지 규칙을 찾기 어렵고 사전을 통해 확인하는 수밖에 없다”며 “한국어에서 가장 발음법칙이 복잡하고 어려운 글자가 리을”이라고 말한다. 

이것이 끝이라면 좋겠다. 벌써 머리가 아프면 이 단락은 읽지 말고 건너뛰자. ‘서울역[서울력]’, ‘알약[알략]’처럼 ‘ㄹ’ 뒤에 모음이 이어지는 단어에서 ‘ㄴ’이 첨가돼 다시 ‘ㄹ’로 발음이 바뀌는 경우도 있는데 이 역시 규칙을 찾기 어렵다. 예외 없이 적용되는 보편 발음규칙도 있는데 ▦‘칼날[칼랄]’ ‘달나라[달라라]’처럼 늘 ‘ㄹ-ㄹ’로 발음(받침 ‘ㄹ’ 뒤에 초성 ‘ㄴ’이 올 경우)하거나 ▦’심리[심니]’ ‘종로[종노]’처럼 ‘ㄹ’을 늘 ‘ㄴ’으로 발음하거나(‘ㅁ, ㅇ’ 받침 뒤에서) ▦‘합리[함니]’ ‘석류[성뉴]’처럼 받침과 ‘ㄹ’이 함께 비음(‘ㅁ-ㄴ’, ‘ㅇ-ㄴ’)으로 바뀌는 경우(‘ㅂ, ㄷ, ㅅ, ㅈ, ㄱ’ 받침 뒤에서)가 그렇다. 

발음대로 쓰지 않는 한국어

이쯤 되면 단지 한글에 쌍리을 없는 게 문제가 아닌 것 같다. 한국어가 과연 표음문자가 맞기나 한 건지 의심스럽다. 아이나 외국인이 처음 한글을 배울 때 어려운 점이 이 대목이다. 연세대 국어국문학과에서 석사과정을 밟고 있는 중국인 학생 쥐이신(鞠鑫)씨는 “처음 한국어를 배울 때 받아쓰기 시험을 치면 늘 틀렸다. 발음 나는 대로 쓰면 맞춤법에 맞지 않았다”고 말한다. 듣기만 해서는 모르는 단어를 사전에서 찾기도 쉽지 않았다고 그는 덧붙인다. “한국인과 대화를 하거나 드라마를 볼 때 모르는 단어가 들리면 사전을 찾고 싶은데 받침으로 뭘 쓰는지를 알 수가 없어요. 예를 들어 ‘혁명’이라는 단어를 찾아야 할 때 ‘형명’ ‘현명’ 등으로 들려서 이런 단어를 찾으면 사전에는 안 나오는 식이죠.” 그는 “특히 겹받침을 쓰는 단어가 가장 어렵다”고 말한다. 같은 과 석사과정 중인 일본 학생 니시오카 리나(西罔莉菜)씨도 같은 이유로 “사람 이름이나 지명처럼 처음 듣는 고유명사를 가장 알아듣기가 어렵다”고 말했다. 

연세대 국어국문학과 대학원을 다니는 외국인 유학생들은 “한글이 표음문자인데도 발음과 표기 사이의 차이가 상당해 배우기가 쉽지 않다”고 입을 모았다. 고영권기자 youngkoh@hankookilbo.com
일어와 비교하면 갑자기 한국어를 배운 게 억울하다고 느낄 수 있다. 일어에서 다리(橋)는 ‘하시’로 읽고 ‘はし’로 쓴다. 새 다리(新橋)는 ‘신바시’로 읽는데 표기 역시 발음 그대로 ‘しんばし’로 쓴다. 소리 나는 대로 쓰고 쓴 대로 읽으니 복잡한 발음법칙과 맞춤법 문제가 없다. 한국어에서도 ‘끄치’ ‘끈나다’ ‘끄테’처럼 소리 나는 대로 쓴다면 아이들은 쉽게 받아쓰기 100점을 맞을 것이다. 

바쁘면 이 단락도 건너뛰어도 된다. ‘끝이’ ‘끝나다’ ‘끝에’를 표기법에 맞다고 하는 것은 한국어가 형태소(의미를 가진 최소 단위)를 유지해 표기하는 원칙을 채택했기 때문이다. 그리고 그 뿌리는 음소 개념을 발견하고도 초성-중성-종성을 모아 한 음절로 표기하는 모아쓰기 원칙을 정립한 세종대왕으로 거슬러 올라간다. 일어는 음소글자가 아닌 음절글자(한 음절이 한 글자)여서 발음을 표기에 반영하기가 상대적으로 쉽다. 때문에 한글을 배우는 아이들은 받아쓰기 시험을 치르느라 힘들어졌지만, 대신 ‘끝나라’와 ‘끈나라’처럼 의미가 다른 단어들을 쉽게 구분할 수 있다. 

세종대왕, 알고도 만들지 않았다

앞의 질문으로 돌아가, 세종대왕은 왜 쌍리을을 만들지 않았을까. 전세계 언어학자들이 인정하는 천재적인 언어ㆍ음성학자였던 그가 음가를 구분 못해 ‘ㄹ’ 한 자에 만족했다고 보기는 어렵다. 세종대왕을 깎아내리고 싶어도 그럴 가능성은 희박하다. 현대 국어학자들이 내놓는 답은 “’ㄹ’의 음가가 둘 이상이라는 것을 세종대왕이 몰라서가 아니라, 필요가 없었기 때문에 추가 글자를 만들지 않았다”는 것이다. 이 무슨 ‘세종대왕 무오류성 원칙’ 같은 소리란 말인가. 

‘ㄹ’ 하나만으로 충분한 이유는 우리나라 말 중에 R/L 소리에 따라 의미가 달라지는 단어가 없기 때문이다. 예를 들어 ‘발’과 ‘팔’은 ‘ㅂ-ㅍ’만 다른데 전혀 다른 의미의 단어가 된다. 그래서 한국어는 ‘ㅂ’과 ‘ㅍ’을 별개의 음소로 구분한다. 그러나 ‘ㄹ’의 경우 이처럼 L/R의 소리 차이로 의미가 구별되는 단어쌍이 전혀 없다. ‘ㄹ’은 한 글자로도 충분했던 것이다.

천재적인 언어학자였던 세종대왕은 음소의 개념을 바탕에 두고 한국어 음가를 체계적으로 분류해 훈민정음 28자를 만들었다. 세종대왕이 L 소리와 R 소리를 구분해 표기할 글자를 따로 만들지 않은 이유는 한국어에서 이를 구분할 필요가 없었기 때문이다. 한국일보 자료사진
음성인식의 최대 난제는 한국어

발음법칙이 복잡하고 예외도 많고 규칙조차 없는 경우가 허다한 한국어의 현실은 최근 발전하는 디지털 음성인식에도 난제를 안긴다. 경계가 명확치 않은 ‘아’와 ‘어’ 소리를 구분하는 것부터 시작해, ‘성뉴’를 ‘석류’로 이해하고, ‘소주’ ‘쏘주’ ‘쐬주’ 등 다양한 발음을 알아듣는 것 모두 난관이다. 

발음만 문제가 아니다. 한국어는 동사의 어미 활용으로 시제, 존칭, 사동/피동 등을 표현하는 등 접사 활용으로 단어의 의미와 문법적 기능이 달라지는 몇 안 되는 언어다. 가령 ‘찾으셨으리라’는 단어를 듣고 동사의 뜻(찾다)과 높임(시), 시제(었), 추측(리라)을 모두 파악하는 것이 AI에겐 만만치 않은 과제다. 하물며 한국인 중에도 어른이 아닌 물건을 높여 말하는 이들이 허다함에랴. 강승식 국민대 소프트웨어융합대학 교수는 한국어 어휘를 기술적 난제로 꼽았다. 강 교수는 “‘노랗다’는 뜻의 영어 단어는 ‘Yellow’로 대표되지만, 한국어에는 ‘노랗다’ ‘누렇다’ ‘노르스름하다’ ‘누리끼리하다’ 등 무수히 많다 보니 AI가 이런 어휘를 다 인식하기가 힘들다”고 말했다. 

세종대왕은 쌍리을을 만들지 않았지만 그는 잘못이 없다. 기계와의 소통이 어렵다고 한국말을 탓할 필요도 없다. 어차피 나면서부터 한국말을 써온 이들끼리도 소통은 어렵고 오해는 쉽다. 

한국일보
Total : 1576
  • 4월 30일-5월 2일 국제애니메이션 야외스포츠 출산아동용품 전람회 연길서   제2회 연길 국제애니메이션, 야외스포츠, 출산아동용품 전람회가 오는 4월 30일부터 5월 2일까지 연길국제회의전시쎈터에서 열린다. 알아본데 따르면 이번 애니메이션전람회는 지난해 전람회의 3배 규모로 준비중이며 cosplay촬영작품 전시...
  • 2016-04-13
  • 4월 23일 “세계 독서의 날”을 맞으며 연변독서협회, 연변독서절조직위원회는 사회 각계와 함께 4월 22일 9시 연길시세기광장에서 제10회 연변독서절 개막식을 성대하게 펼친다. 독서를 즐기는 사회 각계 군중단체들의 참가를 환영한다. 종합
  • 2016-04-13
  • 지난 2013년 4월부터 시작된 우리 주 거리용어물정돈 “공고의 해” 활동은 2015년 12월까지 이어진 가운데 전 주 조선어문사업부문의 광범한 일군들과 군중들의 노력으로 비교적 원만한 결과를 가져온것으로 밝혀졌다.   주조선어문사업위원회에 따르면 지난 3년 동안 우리 주는 각급 부문의 다함없는 노력...
  • 2016-04-13
  • 족보는 가족의 력사를 기술한 사료집성이고 정사, 지방지와 더불어 3대 력사문헌으로서 그 형성과정과 내용에는 문헌학, 서류학, 력사학과 문화인류학 등 학과의 요지가 집중되여있다. 족보연구는 가족 나아가 민족단결을 강화하고 행복지수를 높이며 공동진보를 추진하는데 중요한 사회적의의를 갖고있다.중국에서 가장 큰...
  • 2016-03-29
  • 로신문학원과 손잡고 강습반 조직 연변작가협회가 로신문학원과 손을 잡는다. 연변작가협회 “13.5”기간의 주요사업목표가 확정된 가운데 연변작가협회는 올해 6월에 있게 되는 연변작가협회 제11기 민족문학원 강습반을 시작으로 로신문학원과 손잡고 국내의 쟁쟁한 작가들을 강사로 초빙하여 강의를 펼치고 학...
  • 2016-03-22
  • 문화는 무형의 발전 잠재력이고 사회적 활력과 창의적 인재국가의 바탕으로 된다. 때문에 문화생산과 소비가 위축되여도 생활속 문화향유 요구는 날로 증가하는 추세이다. 이에 기반해 올 한해 우리...
  • 2016-03-18
  • 어언 67년의 장수를 누리고있는 당간행물 《지부생활》은  “사진이 많고 문자가 적으며 창작원고가 많고 편역원고가 적은” 스타일로 변신했다. 《지부생활》잡지는 전국 유일한 조선문 당간행물로써 지금껏 조선족 공산당원들의 흔들림없는 길라잡이였다. 당간행물이라는 특수성때문에 어렵고 무거웠던《...
  • 2016-03-18
  • 원제:양회 현장에 나타난 이들은 누구일가? 제12기 전인대 제4차 회의와 전국정협 제12기 제4차회의가 마감단계에 들어섰다. 3월 3일부터 14일간 열린 중국의 이 최대 정치행사에는 양회 위원과 대표 외에도 민족 언어나 의상 등으로 남달리 눈길을 끄는 사람들이 있었다. "양회 현장에 나타난 이들은 도대체 무슨 사람이들...
  • 2016-03-15
  • 일식은 있어도 중식은 없다. 표준국어대사전 얘기다. ‘일식(日食)’은 일본음식이라 나와 있지만 ‘중식(中食)’은 점심의 다른 말로 풀이된다. 당연히 ‘중식당’도 없다. 사전에서 찾을 수 있는 건 ‘중화요리’ 혹은 ‘청요리’다. 그런데 이 단어들론 현재의 중국음...
  • 2016-03-14
  • [이투데이 정수천 기자] ▲김병기 교수가 '북경인가, 베이징인가'를 출간해 우리의 어문정책에 대한 문제점을 지적했다. (뉴시스)     김병기 전북대 중어중문과 교수가 ‘북경인가, 베이징인가’를 출간해 논쟁이 끊이지 않는 우리의 어문정책에 대한 주장을 펼쳤다. 김 교수는 책 제목부터 ...
  • 2016-03-12
‹처음  이전 81 82 83 84 85 86 87 88 89 90 91 다음  맨뒤›
조글로홈 | 미디어 | 포럼 | CEO비즈 | 쉼터 | 문학 | 사이버박물관 | 광고문의
[조글로•潮歌网]조선족네트워크교류협회•조선족사이버박물관• 深圳潮歌网信息技术有限公司
网站:www.zoglo.net 电子邮件:zoglo718@sohu.com 公众号: zoglo_net
[粤ICP备2023080415号]
Copyright C 2005-2023 All Rights Reserved.