대용량 콘텐츠 번역 전담, 지콘스튜디오
바야흐로 콘텐츠의 시대입니다. 다양한 콘텐츠가 제작되는 콘텐츠 홍수의 시대에 양질의 콘텐츠를 국내 시장에만 머무르게 한다면 너무 아쉬울 것 같아요.
많은 기업과 단체가 해외 진출에 언어가 장벽이 된다는 소식을 듣고 Borderless Creator, 지콘스튜디오에서 진행하고 있는 대용량 번역 작업 하나를 소개하려고 합니다.
여러분은 저희 지콘스튜디오가 다양한 콘텐츠를 번역하고 있다는 사실을 알고 계신가요? 하루에 5O,OOO 단어 가까이 번역하고 있는데요,
심지어 5만 단어나 되는 분량을 한 명의 PM이 관리하고 있다고 해서 인터뷰를 진행해봤습니다. 해외시장을 목표로 유튜브 등의 영상 자막을 번역하려고 하시는 분들께 참고가 되셨으면 좋겠습니다.
Q. 자기소개 부탁드립니다.
안녕하세요. 트위그팜의 선우란 입니다. 의뢰사들과 번역해주시는 번역사님들과 소통하며 PM 업무를 맡아 진행하고 있습니다.
PM : Project Manager. 프로젝트의 감독이자 기획자로서, 전체 스케줄을 효율적으로 진행하고 책임진다. PM은 해당 프로젝트의 커뮤니케이션 전반을 담당한다.
Q. 주요 콘텐츠로 요즘 번역하고 있는 분야와 하루에 지콘이 소화하는 번역 분량은 어느정도 인가요?
보안상 의뢰사를 말씀드릴수 없어서 아쉽네요. 요즘 번역하는 콘텐츠 분야는 주로 예능 분야입니다. 사실 최신 예능 프로그램 뿐만 아니라 10년 이상 지난 다양한 분야의 콘텐츠를 번역하고 있습니다. 지콘스튜디오의 작업 분량은 영단어 기준으로 하루에 적게는 3만 단어부터 최대 5만 단어 가량이 의뢰되어 작업하고 있습니다.
Q. 보통 몇 만 단어를 번역하는 것이 어렵지 않나요?
어렵죠. 너무 어려워요. 기계번역(AI번역)이 있어도 쉬운 일은 아니지만, 절대 기계 번역 없이는 불가능하죠. 저희 회사는 번역 회사가 아니고 번역기를 만드는 회사거든요.
일반 번역 회사에서는 어떤 식으로 하는지는 모르겠지만, 인력이 아무리 충원된다고 하더라도 제 상식으로 5만 단어는 무리라고 생각해요. 저희는 그런 면에서 효율이 좋다고 생각합니다.
콘텐츠 번역 시작 초기에는 작업량이 하루에 2만 단어 미만 이었는데도 쉽지는 않았어요.
Q. 지콘스튜디오는 어떤 부분이 특별할까요?
두 가지 이상의 번역 방식을 접목한 것을 하이브리드 번역이라고 합니다. 하이브리드 번역은 지콘스튜디오의 코어(Core)기능이기도 한 LETR 번역기의 가장 큰 장점이라고 할 수 있어요.
인공 신경망 번역(NMT)과 규칙 기반 번역(RBMT)을 함께 접목함으로써 자연스럽고 정교한 번역이 가능합니다. 현재 LETR 번역기는 특정 용어사전을 사용하지 않아도 자주 등장하는 신조어는 올바르게 번역할 수 있도록 학습되어 있는 상태입니다. 신조어를 자체적으로 학습하는 번역기가 흔치는 않지요. 분야에 나눠서 ICT(Information and Communications Technology, 정보통신기술)사전이든지, 특허분야 사전이든지, 필요한 용어들을 사전으로 구축해서 사용하게 되면 고품질의 번역도 가능하게 됩니다.
이러한 LETR 번역기를 통해 번역하기 때문에 시간과 비용을 절감할 수 있고, 그래서 결국 하루에 5만 단어라는 불가능해 보이는 물량의 번역이 가능하지 않나 싶습니다.
*NMT: Neural machine translation (신경망 기계번역), RBMT: Rule-Based Machine Translation (규칙기반 기계번역)
Q. 아니 근데, PM 한 분이 5만 단어를 처리 하는 게 실제로 가능한가요?
낭비되기 쉬운 시간 소모를 지콘스튜디오가 대폭 감소 해주기 때문에 가능하다고 말씀드릴 수 있습니다.
개인적인 생각으로, PM 1명으로 5만 단어 처리가 가능한 것은 번역사님들의 능력과 스킬 덕분이라고 생각합니다. 왜냐하면 번역사 분들이 스무명 이상 넘어가면, 한 명의 PM으로는 불가능 했을거에요. 저희는 소수의 정예 번역사 분들이 정해진 할당량을 정해진 시간내에 번역해서 제출을 해주시기 때문에 가능하다고 할 수 있겠네요. 정말 번역사분들께 늘 감사드리는 마음입니다.
Q. 지콘에서 담당하는 콘텐츠의 번역 과정은 어떻게 되나요?
번역하는 과정은 우선 크게 자동화와 비자동화로 나뉘고, 번역에서는 기계번역과 사람번역으로 나뉠 수 있습니다.
의뢰사로부터 지콘스튜디오에 번역물이 의뢰되고, 의뢰된 번역물은 LETR를 통해서 기계번역이 진행되지요. 그렇게 작업코드가 부여되면 번역사에게 의뢰가 되고, 번역사는 정해진 시간 내에 번역물을 납품하게 됩니다. 번역사님이 납품하시면, 의뢰사에 최종 납품은 제가 확인하고 진행하고 있습니다.
일반적으로 기계번역이라고 하면 자연스럽게 구글이나 파파고를 떠올리실 수 있어요. 지콘스튜디오의 기계번역은 구어체에 적합화 되어있는 파파고 API를 통해 1차 번역이 되고, 고도화된 트위그팜의 LETR 번역기로 2차 수정하게 됩니다. LETR 번역기는 NER이라고 하는 개체명 인식이나, 필요에 따라서는 비식별화 기능, 검수 기능까지 가능하고요.
명확하게 자동화는 어디부터 어디까지, 비자동화는 어디부터 어디까지 라고 선을 그어서 구분할 수가 없어요. 전체적으로 자동화지만, 또 반드시 비자동화, 그러니까 사람의 역할이 필요하거든요.
무엇보다도 인공지능 번역이 아무리 똑똑하다고 하더라도 예능이나 드라마, 구어체로 이루어진 창작물 번역은 기계번역으로는 한계가 있기 때문에 반드시 사람의 번역을 거쳐야 합니다. 앞으로는 어떻게 될지 모르지만요.
Q. 재미있는 에피소드가 있을까요?
에피소드라고 하면 역시 기계의 오번역이겠죠? XD 아무래도 현재 기계번역에는 한계점이 있어요.
특히 말씀드렸던 창작물, 구어체에는 신조어나 줄임말 등으로 인한 오류가 왕왕 발생하여 오번역이 생기기도 하지요.
기억에 남았던 재미있는 오번역 사례를 들어보자면,
😅(힘/기세/위력 등을 나타내는 대사에서) “오, 세다! 세다!” -> "Oh, count! count!"
😅(감탄사) "오!" 같은 경우에도 숫자 "5" 또는 "five"로 번역되어서 나오는 경우도 발생.
😁"멍충이" 같은 단어는 뒤에 "충" 이라는 글자 때문인지 벌레를 뜻하는 "worm" 으로 번역되기도..
🤣친족 호칭 표현에서도 "동서"(며느리 간 호칭) 는 동쪽과 서쪽을 의미하는 "East West"로..
😂이쪽으로 와 라는 구어체 표현인 "일로 와" 는 작업을 뜻하는 "Come to work" 로 번역될 때도 있답니다.
콘텐츠 대용량 번역, 레터웍스를 통해서 경험해보세요!
궁금한 사항은 채널톡 문의주세요~
*해당 콘텐츠는 지콘스튜디오에서 레터웍스로 이관되었습니다.