한국어가 모국어라 다행입니다.
질문하나 먼저 드려보겠습니다. 10월 9일은 무슨날인가요? 네 맞습니다. 한글날입니다.
약 500여년 전 세종대왕을 필두로 집현전 학자들이 함께 훈민정음, 곧 오늘의 한글을 창제하여 세상에 펴낸 것을 기념하는 날이지요. 한글은 인류가 사용하는 문자 중에서 창제자와 창제연도가 명확히 밝혀진 몇 안되는 문자입니다. 또한 한글은 발음과 글자가 일치하는 문자, 발음을 할 때 소리를 만드는 위치와 방법을 알고 과학적으로 만들어진 문자, 단순한 기호의 조합으로 이루어진 문자, 발음과 글자가 일치하는 문자라는 점에서 세계적으로 우수하게 평가 받고 있습니다. 물론 한글과 한국어는 상이합니다. 한국어는 한글이 생겨나기 전에도 존재했지요. (이 부분은 나중에 다루기로 할게요.) 한글날을 맞이하여 번역을 할 때 다른 외국어보다 한국어를 사용한 번역이 쉽지 않은 이유를 살펴보겠습니다.
고립어 굴절어 교착어
한국어 번역이 어려운 수많은 이유가 존재하겠지만 가장 대표적인 한가지 이유를 살펴보려고 합니다.
그것은 바로 언어별로 언어학적인 분류의 차이가 있기 때문에 한국어 번역이 어렵다는 것입니다.
학창시절 국어시간에 심화과정으로 배웠던 고립어, 교착어, 굴절어 기억하고 계시나요? 대학 교양 수업에도 종종 등장하는 용어인데요. 각 용어에 대해서 먼저 간단하게 설명을 드리겠습니다.
고립어는 문장의 형태 변화가 없고, 문법적 관계가 주로 어순에 의해 표시되는 언어를 말합니다. 각 단어가 문법적인 변화를 나타내지 않아요. 고립어의 대표적인 언어로는 중국어를 들 수 있습니다. 예를 들어, “나는 그녀를 사랑한다”, “그녀는 나를 사랑한다.” 라고 영어와 비교해서 설명해보겠습니다. 영어로는 I love her. (나는 그녀를 사랑한다), She loves me. (그녀는 나를 사랑한다) 라고 합니다. 각 주어/목적어에 따라 동사의 형태변화와 단어의 격(格)이 바뀌지요. 그러나 고립어인 중국어는 我爱她 (나는 그녀를 사랑한다), 她爱我(그녀는 나를 사랑한다) 와 같이 단어가 놓이는 어순으로 그 특징이 드러납니다. 태국어와 베트남어도 고립어에 속하지요. 물론 관점에 따라 영어는 고립어가 되기도 하고 굴절어가 되기도 합니다. 같은 단어의 위치에 따라 명사가 되기도 하고 형용사가 되기도 하는 점에서 그렇지요. 어쨌든 고립어는 어순에 따라 쓰임이 정해지는 언어입니다.
굴절어는 어형과 어미의 변화로 단어가 문장 속에서 가지는 여러가지 관계를 나타내는 언어를 말합니다. 성(性), 수(數), 시제(時制), 인칭(人稱) 등에 문법적인 범주가 있어서 이에 따라 변화합니다. 유럽에 있는 대부분의 언어나 러시아어 등이 이에 속하지요. 어순은 자유로운 편이지만 어미의 변화나 인칭 변화 같은 법칙을 기억해야합니다.
교착어는 품사에 민감합니다. 하나의 단어에 다른 품사가 붙습니다. 조사가 어미에 붙는 것으로 문장에서 단어의 역할이 정해지지요. 바로 한국어나 일본어가 대표적인 교착어입니다. 나는 그녀를 사랑한다. 나는 사랑한다 그녀를. 그녀를 나는 사랑한다. 라고 어순이 바뀌어도 이해가 되고 의미가 통하는 것은 교착어의 특징 때문입니다. 물론 언어는 변화하기 때문에 이런 언어학적 분류조차 파괴하는 예외적인 상황도 종종 등장하지만, 큰 범주로써 언어학적 분류의 차이 때문에 기계번역도, 인간의 번역도 어려움을 마주하게 됩니다.
이밖에도 한국어만이 가지고 있는 특징이 한국어 번역을 어렵게 합니다. 경어, 즉 존칭표현이나 영어에 비해 단어의 수가 많다는 점(사전에 수록된 단어 기준) 이 번역을 어렵게 만들기도 합니다. 상황과 대상, 문맥에 따른 격식있는 표현을 사용하는지, 연장자인지의 여부에 따라 의사소통의 성패가 결정됩니다. 상대 높임법에 따라 번역이 달라질수도 있지요. 해요체나 합쇼체, 해체 등의 다양한 동사 활용형을 외국어에 적용하게 되면 번역할 때 혼란이 가중될 수 있기 때문에 유의해야합니다.
(한국어가 모국어라서 참 다행인 1인입니다.🤣)
***
지콘스튜디오 번역 서비스를 제공하는 Twigfarm의 수장, 자연어 처리 전문가 백선호 대표가 말하는 한국어의 자연어처리(NLP) 과정이 특히 어려운 이유도 비슷한 맥락인 것 같습니다.
“한국어는 창의적인 언어입니다. 주어 목적어 동사의 어순을 다양한 현태로 바꿀 수 있고, 특정 단어를 생략, 축약 시켜서 같은 내용의 문장이라도 새로운 느낌을 부여할 수 있습니다. 이러한 다양성은 규칙과 패턴을 좋아하는 기계가 이해하는데 어려움이 있습니다. 한국어는 동사의 형변화도 다양합니다. 영어의 경우는 시제와 인칭에 따른 형변환만 있지만, 한국어는 높임말 등 말하는 사람, 듣는 사람에 따라서 상황에 따라서 다양하게 동사의 어미가 변합니다. 기계 번역기의 연구는 영어와 같은 서구 언어 중심으로 이루어져 있기에, 창의적인 한국어를 기존의 방법에 적용해서 사용하기에는 어려움이 있습니다.” -트위그팜 대표 백선호
다음 포스팅에서 만나요~
*해당 콘텐츠는 지콘스튜디오에서 레터웍스로 이관되었습니다.