인공지능 번역(기계번역)이 영상자막 작업에서 불편한 이유
시작하기
기계번역으로 영상 자막을 돌렸을 때, 어절들이 뿔뿔이 분절되어 문장으로 합치는 데 애먹었던 경험이 있었다면 이번 노트를 주목해주세요. 레터웍스만의 문장 조립 기능과 함께 적용 사례를 소개해 드리려고 해요.
- 문장 조립: 콘텐츠 속 문장 파싱 시, 잘못 분절된 구간을 바로잡아 주는 AI 문장 패러프레이즈 인식 기능
영상자막을 AI로 돌리면 일어나는 일
열심히 만든 영상, AI 트랜스크립션으로 자동화했을 때 어떤 현상이 벌어질까요? 아래 사례처럼 유튜브 한글 CC 자막을 켰을 때 발화 속도에 따라 어절이 분리되어 노출되는 것을 확인할 수 있는데요.
발화 시점에 맞게 시간차로 음성 전사가 될 경우, 소리 없이 영상 자막만으로 내용을 확인할 때 전체 맥락을 파악하기 어렵다는 단점이 있습니다. 반면 자막이 매끄럽게 문장으로 떨어지면 한 눈에 쓱 봐도 화자의 대사를 이해할 수 있어 편리하죠. 이와 같은 어절 분리는 자막작업을 위해 AI 프로그램을 썼을 때 흔하게 일어날 수 있는 현상입니다.
문장 조립, 패러프레이즈 인식 기능
레터웍스 팀에서도 드라마, 예능, 강의, 유튜브 등 다양한 영상 콘텐츠 번역 작업을 할 때 자막의 어절이 분리되는 현상을 종종 마주했습니다. 번역 전 전사에서부터 원문이 단절되면 문장을 맞추는 작업부터 공수가 많이 들어갈 수밖에 없었는데요.
현업에서 발생하는 불편함을 줄이기 위해 레터웍스에서 직접 문장 조립 기능을 도입했습니다. 아래와 같이, 좌측 [원문] 영역에서 완결된 형태의 조립된 문장이 파싱된 것을 보실 수 있어요.
이후 영상 속에서 동일한 구간을 번역 프로젝트로 돌려봤습니다. 깔끔하게 맞춰진 원문을 기반으로 번역문에서도 잘 조립된 형태의 완성도 높은 문장이 추천되었습니다.
영어, 한국어뿐만 아니라 중국어, 일본어 등 다양한 외국어 파싱 시에도 문장 조립이 적용되어 기계번역의 품질을 한껏 끌어올릴 수 있게 됐죠. 완성도 높은 원문은 좋은 품질의 번역문으로 이어집니다.
영상 번역 작업의 효율과 품질을 높이기 위한 레터웍스의 연구는 앞으로도 계속되니 꾸준히 지켜봐 주세요!
함께 보면 좋은 콘텐츠
🔗영상 번역 톺아보기#1 영상 번역이 완성되는 6단계
🔗영상 번역 톺아보기#2 복잡할수록 많은 사람과 일할수록 보안이 중요합니다.
🔗영상 번역 톺아보기#3 SDH, CC, Subtitle 업계에서 어떻게 구분해서 사용하고 있을까요?
🔗영상 번역 톺아보기#4 청각장애인용 자막(SDH)은 어떻게 작업될까요?
🔗영상 번역 톺아보기#6 캐릭터 말투, 화법을 살리는 번역
Editor l 김보미