Chat GPT, LLM 발전이 기계 번역의 발전이 어떤 도움이 될까
시작하기
번역 신에 계시는 분들이라면 제가 오늘 제목에서 언급한 Chat GPT와 LLM에 대해 관심이 많을 것이라고 생각이 들어요. 사실상 Chat GPT는 번역 계통에 종사하고 있지 않더라도 관심을 가질만한 주제이기도 하죠. 워낙 광범위하게 많은 산업에 영향을 주고 있는 부분이기도 한데요. 기계 번역 자체가 AI를 기반으로 이루어지는 작업이다 보니 Chat GPT의 발전은 번역 신과 관련이 있는 부분이기도 해요. 그래서 오늘은 그 중에서도 그러한 기술의 발달이 번역에 어떠한 도움을 줄 수 있는지에 대해 적어 보려고 합니다.
LLM이란 무엇일까
LLM이란 Large Language Model의 약어로 그대로 해석하면 초거대 언어 모델, 대규모 언어 모델 등으로 해석이 가능합니다. LLM이 기계 번역에 미칠 영향이 기대가 되는 것은 그게 다양한 자연어 처리 작업을 수행할 수 있는 딥 러닝 알고리즘이기 때문입니다. 훈련을 통해 텍스트를 이해하고 생성할 수 있는 딥러닝 모델인 것이죠. 이 학습을 통해 궁극적으로 자신이 알고 있는 지식을 기반으로 한 답변, 텍스트 분류부터 시작해서 카피라이팅과 같은 작업까지 가능해요. 그렇다면 LLM이 기계 번역의 성능에는 어떻게 영향을 끼칠 수 있을까요?
Chat GPT란 무엇일까
Chat GPT는 자연어 처리를 위해 개발된 대형 언어 모델, 즉 LLM입니다. Chat GPT의 활용은 분야 무관하게 어떤 질문이든 대화 식으로 답하는 챗봇, 분류, 요약 보고, 질의응답 시스템 등과 같은 자연어 처리 테스크에서 활용 가능하며 실제로 활발하게 사용되고 있죠. 앞선 단락에서 LLM에 대해 설명한 것들이 Chat GPT에서는 모두 가능한데요. 실제로 많은 사용자가 Chat GPT를 실생활에서, 업무에서, 또는 학업에서 이용하고 있습니다. LLM이 반영된 이러한 기술은 궁극적으로 기계 번역이 나아갈 길을 제시해줍니다. 기계 번역 이후에 포스트에디팅 작업을 거쳐야 하는 지금이지만, 계속해서 이러한 기술이 발달하게 된다면 후처리에 들어가는 시간적 비용이 줄어들 수 있게 되지 않을까 하는 생각이 듭니다.
LLM의 발전과 번역의 상관관계
두 기술의 발전이 번역에 도움을 줄 수 있다는 건 누구나 알 수 있는 사실이죠. 그렇다면 구체적으로 어느 부분에서 도움을 줄 수 있을까요. 저는 LLM 기술이 가진 다른 어느 기능보다 ‘불완전한 문장을 완성'해준다는 것에 마음이 끌렸어요. 이것이야말로 번역에 도움을 줄 수 있는 필수적인 기능이라고 보였거든요. 글을 쓸 때는 물론이고 말을 할 때도 문장성분이 완전히 갖춰진 상태의 문장을 쓰거나 발화하지 않는 때가 간혹 있어요.
소설을 쓸 때 바로 이전 문장에서 주어가 언급된 경우, 다음 문장에서는 생략되기도 하는 것처럼 말이죠. 말할 때도 마찬가지죠. 대화를 나누는 사람들끼리 무엇을, 혹은 누구에 대해 얘기하는지 알고 있다면 그 부분은 생략될 수 있는데요. 이때, 기계 번역에 문제가 생기곤 하죠. 한 세그먼트마다 번역을 하게 되는데 문장 성분이 빠져 있으면 임의로 채워서 번역을 할 때가 있거든요. LLM은 이때 생기는 오류를 줄여줄 수 있다는 생각이 들어요. 바로 이전 문장의 주어를 참고해서 다음 세그먼트에서 주어를 예측할 수 있는 것이죠. 이러한 부분 때문에 저는 다른 무엇보다 영상 번역을 할 때 도움을 줄 수 있는 부분이 많을 거라 기대가 돼요. 전사 작업에 들이는 에너지를 줄일 수 있게 해줄 것이라고 기대가 되더라고요. 지금보다 더 발전할 LLM과 그와 함께 더 완성도가 높아질 기계 번역을 기대하며 오늘 노트를 마치도록 하겠습니다.
Editor / 이인혜