SOL 프로젝트는 트위그팜 LETR팀이 NIA 그리고 멀티캠퍼스와 손 잡고 우수한 인공지능 인재 양성을 지원하는 프로그램입니다. 교육생들이 현업 실무 프로젝트를 경험하고, LETR팀 연구 개발 문화를 가까이에서 체험해 볼 수 있는 기회입니다.
프로젝트 1기에는 지난 8월부터 9명의 예비 개발자들이 3개월이 넘는 기간 동안 LETR팀과 함께했습니다. 실제 현장을 더 밀접하게 경험하기 위해 3개 조로 나뉘어 팀 프로젝트를 진행하였는데요. 프로젝트 멘토링을 통해 현업에 있는 LETR팀 연구원들과 교류, 협력하는 시간도 있었습니다.
이번에는 얼마전 마무리 된 1기 참가자 9명의 이야기를 들어봤습니다. 실제로 프로젝트를 진행하면서 각자가 느낀 바가 달랐을 것 같은데요. 이 경험을 통해 무엇을 배우고, 생각하고, 느꼈는지 솔직한 이야기를 남겨주셨습니다.
첫 번째 순서로 ‘자연스러운 한국어’ 프로젝트에 참여한 예찬님, 찬선님, 지원님 3명의 이야기를 소개드립니다.
인공지능은 처음(?)이라서
안녕하세요. 자기소개 부탁드려요!
예찬: 안녕하세요. 원래는 한국항공전문학교에서 항공정비공학을 전공했는데, 이직을 준비하던 중 인공지능에 관심을 갖게 되었습니다.
찬선: 한국외국어대학교 언어인지과학과에 재학중이고, 현재 트위그팜 인턴으로 근무하고 있습니다.
지원: 올해 28살로 고려대학교 철학과를 졸업했습니다. 이전까지는 철학에 매진하는 인생을 살던 비전공자였어요. 현재는 인공지능과 논리학에 관심이 많습니다.
인공지능, 그 중에서도 자연어처리에 관심을 갖게 된 이유는 무엇인가요?
예찬: 무엇보다 다양한 기술에 접목할 수 있는 거대한 분야라고 생각했어요. 역사적으로도 문자가 수 많은 분야의 발전을 앞당겼는데, 저에게도 NLP가 다양한 분야에 도전할 수 있는 기회라고 느껴졌습니다.
찬선: 학교에서 언어학적인 소양을 쌓아온 것이 계기가 되었어요. 개인적으로도 문화에 따라 다른 사람들의 언어에 대한 인식에 관심이 많았던 것이 공부를 시작하게 만들었습니다.
지원: 철학을 오래 공부했고, 언어학에도 관심이 많다 보니 ‘왜 자연스러운 언어는 직관적일까?’라는 의문이 들었습니다. 사실 언어는 직관적으로 이해해야 하는데, 성인이 되면 외국어를 직관적으로 이해하기 매우 어려워지더라고요.
인공지능의 경우 딥러닝 기반 번역이 직관적인 이해와 유사하다고 생각하는데, 이를 통해 역으로 인간의 직관을 이해할 수도 있을 것 같았습니다. 이 부분이 흥미롭고, 그 과정을 알고 싶어 관심을 갖게 되었습니다.
SOL 프로젝트를 경험해보니
SOL 프로젝트에 지원하게 된 계기는 무엇인가요?
예찬: 현업에서 어떤 방식으로 일을 진행하고, 어떤 데이터를 사용하며, 어떻게 데이터를 구축하는지 경험해보고 싶어서요.
찬선: 실무에서는 어떻게 자연어처리가 이루어지고, 어떤 분야와 주제로 발전하고 있는지 목격하며 시야를 넓히려고요.
지원: 실무에서 어떻게 업무를 진행하는지 빨리 알고 싶었어요. 그리고 실제 프로젝트를 진행하며 더 빨리 성장하고 싶었습니다.
SOL 프로젝트를 통해 어떤 경험을 하셨나요?
예찬: 선행 논문 자료를 수집하고 분석하며 필요한 기술을 탐색했고, 필요 데이터를 구축하고 논문의 모델을 비교 테스트하며 프로젝트에 적용할 모델을 선정하는 작업을 진행했습니다. 특히 프로젝트 주제를 정의하고, 방향을 잡는 논의를 자주 한 것이 기억에 남네요. 그 과정에서 어떤 데이터를 어떻게 활용하지 방향을 잡고, 모델을 어떻게 수정할지 틀을 잡아갈 수 있었습니다.
찬선: 사실 딥러닝 모델은 거의 처음이라 많이 어려웠는데, 그래도 함께한 팀원들 덕분에 이해도를 높일 수 있었습니다. 그 과정에서 데이터 수집, 전처리 등 작업을 하며 이전보다 성장할 수 있었던 것 같아요.
지원: 프로젝트에서 부자연스러운 한국어를 자연스러운 한국어로 변환하는 일종의 번역기를 만드는데 목표를 두었습니다. 현실적인 한계는 있었지만, 여러가지 딥러닝 모델을 통해 역번역된 한국어와 원문 한국어를 훈련시켰습니다.
팀원들과 함께 프로젝트를 진행하며 느낀 것은 무엇인가요?
예찬: 이전까지는 일단 시도해보고 판단하는 것이 맞고, 결과에 맞춰 방향을 잡는 것이 당연하다 생각해왔습니다. 하지만 이런 방식이 비효율적일 수 있고, 상황에 따라 유연하게 변화해가야 한다는 것을 깨달을 수 있었어요.
무엇보다 팀원들과 소통이 가장 중요하다는 생각이 들었습니다. 프로젝트 주제에 대한 정의도 더 신중하게 내리고, 진행 방향에 대해서도 충분한 논의를 가졌다면 더 좋았을 것 같다는 아쉬움이 남네요. 다시 팀 프로젝트를 하게 되면 더 자주 의견을 나누고, 교류할 수 있도록 노력하고 싶습니다.
찬선: 많이 부족하다 생각해 조금이라도 팀에 도움이 되려 노력했습니다. 그 와중에 이 분야가 정말 많이 발전하고 있고, 앞으로 가능성도 큰 분야라고 느꼈어요.
지원: 개인적으로 베이스라인 코드를 돌릴 때‘잘 돌아가는’것만 확인할 게 아니라, 베이스라인 코드와 나의 데이터의 차이점은 무엇인지 파악해야 한다는것을 배웠습니다. 그러지 않으면 베이스라인 코드를 돌리고나서 생기는 오류나 문제가 어디서 발생하지 파악하기 어렵더라고요.
프로젝트를 마무리하며 가장 가장 기억에 남는 일은 무엇인가요?
예찬: 처음으로 함께 진행한 프로젝트여서 설렘이 컸고, 논문 기반으로 프로젝트를 완성하는 경험을 할 수 있어 많은 도움이 됐습니다. 특히 나중에 실무자로서 일하게 될 때 이번 경험을 토대로 잘 헤쳐나갈 수 있겠다는 자신감을 가질 수있었습니다.
찬선: (어려운 일도 있었지만) 팀원들이 서로 도우며 끈기있게 함께 일한 것이 가장 기억에 남습니다.
지원: 프로젝트 결과를 발표한 일이 가장 기억에 남습니다. 발표 자료를 정리하며 많은 생각이 머리 속을 스쳐가더라고요. 완벽한 결과는 아니었고, 부족한 부분도 많아 사실 마음이 좋지만은 않았습니다. 하지만 함께 한 팀원들, 멘토링해주신 대표님과 연구원분들의 격려가 많은 힘이 되었습니다.
SOL 프로젝트, 그 이후
앞으로 도전하고 싶은분야, 이루고 싶은 목표는 무엇인가요?
예찬: 당장은 여러가지 분야를 탐색중인 상황이지만, 언젠가 아이언맨의 자비스 같은 인공지능을 개발하고 싶은 꿈이 있습니다. 구체적으로 항공기에 탑재되어 조종사와 커뮤니케이션하고, 정보 공유 및 컨트롤이 가능한 서브 운항 시스템을 개발해보고 싶어요.
찬선: 개인적인 욕심은 한국어의 언어학적 중의성에 따른 문제를 해결하는 과정에 힘을 보태고 싶습니다. 가능하다면 뉘앙스의 차이에 따른 오역까지 해결할 수 있는 연구를 해보고 싶어요.
지원: 우선은 아직 마무리하지 않은 프로젝트 과제를 끝내는 것이 목표입니다. 당장은 코딩 실력을 키우는데 집중하고 있지만, 꼭 이번 과제로 실제 성과를 만들어내고 싶어요.
마지막으로 앞으로 프로젝트를 경험하게 될 후배들에게도 한 마디 남겨주세요.
예찬: 팀원들 간 많은 대화와 논의를 통해 기준을 명확히 정하고 프로젝트를 진행하시면 좋을 것 같아요. 추가로 코로나 상황이 나아져 오프라인 협업이 활성화되면 더 좋을 것 같습니다.
찬선: 저도 했어요! 여러분도 가능하세요!
지원: 시간 관리가 중요합니다. 한 주는 느리게 가는 것 같지만, 3개월은 금방 지나가더라고요. 계획을 잘 짜서 규칙적으로 움직이는게 중요합니다!
함께보면 좋은 콘텐츠
언어처리 엔진 LETR는 왜 텍스트 언어에 집중할까?