기계 번역이 가지는 한계가 있다면
시작하기
AI 발전에 맞춰 무궁한 발전을 이어온 기계 번역이지만 한계 또한 여전히 존재하는데요. 어떤 것이 있을까요? 우선, 생략된 정보에 대해서는 해석이 어렵다는 것을 말할 수 있겠네요. 의식하지 못하시겠지만 우리는 문장의 문장 성분을 완벽하게 구사해서 발화하는 경우가 많지 않습니다. 때로는 주어를, 또 어떤 때에는 목적어를, 그리고 꽤 자주 말끝, 즉 문장의 끝을 제대로 처리하지 않고는 하죠. 일련의 대화를 한 번 예로 들어 설명해볼까요?
드라마 <내 남편과 결혼해줘> 10화
양주란 : 어떻게 이런 사고를 칠 수가 있어? 아니 사고는 쳤다 치고 이걸 덮어?
박민환 : 예? 예 뭐...?
양주란 : 조 마트 알러지 고지 미비로 난리 났었다며. 이걸 왜 보고도 안 하고
박민환 : 그걸 어떻게...
양주란 : 조마트 측에는 사과는커녕 오히려 큰소리 치고.. 그쪽 직원 실수?
위의 대사는 드라마 <내 남편과 결혼해줘>의 일부를 인용해 온 것인데요. 보시면 문장이 완벽하게 종결되지 않은 문장들이 있죠. 또한, 앞에서 언급한 내용은 생략되기도 하는 등의 모습이 나타나는 것을 확인하실 수 있어요. 만약에 완벽한 문장으로 적는다면 내용은 이렇게 되겠죠.
양주란 : 어떻게 이런 사고를 칠 수가 있어? 아니 사고는 쳤다 치고 이걸 덮어?
박민환 : 예? 무슨 사고를 말씀하시는 건지 모르겠습니다.
양주란 :조마트 알러지 고지 미비로 난리 났었다며. 이걸 왜 보고도 안 하고 넘겨?
박민환 : 알러지 고지 미비로 사고가 난 걸 어떻게 아셨어요?
양주란 : 조마트 측에는 사과는커녕 오히려 큰 소리 치고 그쪽 직원 실수라고 했다며.
두 번째로 쓴 대사가 문법적으로 옳은 문장이지만 이걸 영상으로 본다고 생각하니 오히려 더 어색하게 느껴지실 거 같아요. 완벽한 문장 성분을 갖춘 문장을 만들었을 때 오히려 더 어색하게 느껴지기도 한다는 게 ‘말'의 특징이에요. 우리는 실생활에서 이렇게 제대로 말하지 않기 때문이죠. 바로 이러한 부분에서 문서 번역과 영상 번역에는 차이가 생기게 되는데 이에 대해 조금 자세히 적어볼까 합니다.
문서 번역과 영상 번역의 차이
문서 번역의 경우에는 문장 성분이 완벽하게 갖춰져 있는 경우가 많아요. 그렇기 때문에 기계 번역의 한계에 대해 생각할 일이 이전처럼 많지는 않죠. 계속된 연구와 개발을 통해 문장 성분이 완벽한 문장에 대해서는 꽤나 정확도 높은 해석 결과물을 내놓죠. 하지만 문제는 영상에 대한 번역을 할 때는 한계점이 드러나곤 해요. 위에 예로 든 문장처럼 문장 성분이 생략되었을 때, 그 부분을 놓치는 경우도 있고요. 앞에서 얘기한 내용의 경우 뒤에서 생략이 되곤 하는데 기계 번역을 했을 때, 이 부분은 제대로 번역이 되지 않는 경우가 있어요.
레터웍스는 어떻게 보완하고 있을까
자막 글자 수 설정이 가능해요. 레터웍스로 프로젝트를 맡기기 전 글자 수 설정이 가능하게 함으로써 최대 글자 수를 미리 설정하여 추후 편집 과정이 보다 용이하게 이루어질 수 있게 하고 있어요. 들어갈 시간과 노력을 줄여줄 수 있죠.
TB 용어집 기능을 통해 더 빠른 번역이 가능하게 해요. 영상에서 반복되는 용어들을 하나로 통일하여 자막의 품질을 높임으로써 더 정확한 번역을 가능하게 해요.
TM, 문장 추천 기능을 활용할 수 있어요. 아시다시피 AI는 학습할수록 보다 나은 결과물을 도출해낼 수 있어요. 그 동안 레터웍스가 진행했던 번역 사례들을 학습하여 상황에 맞게 문장을 추천함으로써 더 빠른 번역이 가능해지죠.
콘텐츠의 현지화에 관심이 많아지고 있는 요즘, 웹툰, 영상 등 다양한 분야에서 번역에 관심을 보이고 있어요. 이 말은 곧 구어체 번역의 중요성이 갈수록 커질 것이라는 예상이 가능하게 하는데요. 레터웍스에서는 기계 번역이 가지게 되는 필연적인 한계에 대해 끊임없이 고민하고 해결책을 제시할 예정이니 앞으로도 많은 관심을 가지고 지켜봐 주세요.
Editor / 이인혜