기계 번역이 맘에 들지 않는다면
일상생활을 하다 보면 기계 번역을 이용해야 하는 상황이 자주 있는 것 같아요. 제 주변에서도 기계번역을 한 번 돌려본 후 번역이 맞는지 묻는 경우가 더러 있는데요. 그렇게 친구가 보내준 문장들을 보고 있으면 어색하게 느껴질 때가 있어요. 그 문장을 그대로 쓰기에는 다소 어색한 감이 있다는 피드백을 전하면 실망스러운 반응을 보이곤 합니다. 근데 이 상황에서 잘못은 정말 번역기에만 있는 것일까요? 오늘은 이를 주제로 레터를 적어보려고 해요.
대부분의 사람들은 구글, 파파고 등의 번역에 신뢰도가 높지 않은데요. 하지만 사람들의 이런 생각과 달리 인공지능 번역 분야의 글로벌 선두주자인 구글번역, 그리고 대한민국에서 인기가 많은 번역기인 파파고는 성능이 우수한 편이에요. 그래서 사람들은 구글 번역기와 파파고 번역기를 이용해서 ‘초벌 번역'을 한 뒤에 수정하는 식으로 기계 번역기를 이용하고 있는 모습이에요.
그런데 왜 번역 퀄리티에 대해서는 만족하지 못하는 경우가 종종 생기는 걸까요? 그건 바로 기계번역기가 돌아가는 원리를 제대로 파악하지 못하고 사용하고 있기 때문일 가능성이 높아요. 오늘 레터를 통해서는 구글과 파파고로 대표되는 기계번역을 더 효과적으로 활용하는 방법도 함께 알려드릴게요.
기계 번역에 대해 얼마나 알고 계신가요?
언어는 사람의 의식과 생각이 개입된 콘텐츠죠. 그래서 기계 번역, 즉 AI 번역은 인간에게 학습된 데이터를 통해 발전하는 형태를 띄고 있어요. 기계 번역은 규칙기반, 예문기반, 통계기반 기계번역을 거쳐 신경망 기계번역에 이르기까지 수많은 과정을 거쳐 지금의 상태에 도달했어요. 조금도 쉬지 않고 발전을 거듭해 온 기계번역이지만 여전히 한계는 존재해요. 그건 바로 번역기 스스로 생각하는 능력을 갖는 일인데요. 그래서 사람이 번역을 요구하는 원천 텍스트를 어떻게 입력하는지가 매우 중요해요. 그게 번역의 오류를 줄일 수 있는 가장 기본적인 방법인 셈이죠. 그렇다면 원천 텍스트를 잘 입력할 수 있는 방법에는 뭐가 있을까요? 어떤 부분에 주의해서 텍스트를 입력해야 할까요?
바로 아래와 같은 경우를 피하면 됩니다
길고 복잡한 문장
주어 파악이 되지 않는 문장
문장 내에서의 의미 해석이 되지 않는 문장
맥락의 이해가 어려운 문장
문장이 길고 복잡하면 변수가 많아지게 돼요. 통사적 구조가 복잡하기 때문에 원문의 의미가 왜곡되거나 문맥의 연결이 매끄럽지 못한 경우가 생기기도 하고요. 문장이 길어질수록 비문이 길어질 확률이 높아지게 되죠.
다음으로 문제가 되는 부분은 주어의 파악이 되지 않는 경우입니다. 올바른 문장을 완성하기 위해 주어를 제대로 밝혀주는 건 너무나 중요한데요. 하지만 한국어의 언어생활 특성상 주어를 생략하는 경우가 많습니다. 그래서 번역기에 원천 문장을 입력했을 때 번역된 결과값이 만족스럽지 못하게 되는 경우가 있죠.
마지막으로 문장 내에서 의미 해석이 되지 않는 경우, 그리고 맥락의 이해가 어려운 경우가 있습니다. 그 나라에서만 사용하는 관용어를 사용하거나 신조어 등을 사용할 때 발생되는 문제인데요. 기계번역기에 이렇게 구성된 원천 문장을 넣었을 때 맥락을 파악하지 못해 엉뚱한 문장을 출력하게 되는 것입니다.
결과적으로 말하자면 올바른 문장을 구사해서 번역기에 입력하는 것이 기계번역을 잘 쓸 수 있는 방법이 되는데요. 저희 레터 웍스에서도 더 나은 번역을 제공하기 위해 노력하고 있는데요. 나날이 고도화되고 있는 하이브리드 기계번역은 사용하는 사람들이 많을수록 그 품질이 올라갑니다. 기업별 맞춤형 번역기를 제공하고 있으니, 관련해서 상담이 필요하시다면 채널톡을 통해 언제든 문의주세요. 그럼 오늘도 도움이 되셨기를 바라며, 저는 다음 레터에서 뵙겠습니다.
Editor l 이인혜