최근 인공지능 신의 가장 뜨거운 감자는 ChatGPT입니다. 일반인들도 왠만하면 이름 정도는 들어 본 것 같고, 실제 사용까지 해봤다는 이야기도 꽤 많이 들려오고 있죠. 덕분에 업계는 물론이고 전 세계의 다양한 매체를 통해 기대와 우려의 목소리들이 계속해서 쏟아져 나오고 있습니다.
독보적인 미친 존재감
3.5년, 2.5년, 10개월, 5개월, 2.5개월, …
이상은 순서대로 넷플릭스(Netflix), 페이스북(Facebook), 스포티파이(Spotify), 인스타그램(Instgram)이 100만 사용자를 달성하기까지 걸린 시간입니다. 그런데 얼마 전 이 쟁쟁한 서비스들의 기록을 단숨에 갈아치운 새로운 슈퍼스타가 등장했죠. 바로 출시 5일만에 이들을 뛰어넘어 버린 OpenAI의 ChatGPT입니다.
그렇다면 사람들은 왜 이렇게 ChatGPT에 열광하는 걸까요?
물론 누구나 쉽게 채팅 서비스처럼 이용할 수 있게 무료 공개한 덕분에 소셜 미디어를 통한 바이럴이 활발하게 일어난 이유도 있습니다. 그래도 (급속도로 변해가는 이 신에서) 출시 3개월이 지난 현 시점에도 여전히 핫 하다는 것은 대단한 일이죠. 도대체 어떤 엄청난 녀석이길래 이렇게 주목을 받고 있는 건지, 어떻게 활용할 수 있고, 어떤 영향을 미치게 될 지 차근차근 알아보겠습니다.
그 녀석이 알고 싶다
우선 ChatGPT를 공개한 OpenAI 블로그의 소개 글부터 확인해보겠습니다.
We've trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests.
OpenAI의 설명처럼 ChatGPT는 사용자와 대화하듯 상호작용할 수 있게 훈련된 일종의 언어 모델입니다. 언뜻 보면 단순 챗봇처럼 느껴질 수도 있지만, 이녀석의 진면목은 그 다음 문장에서부터 드러나죠. 바로 대화를 통해 ‘이어지는 질문에 답하고, 답변의 실수를 인정하며, 잘못된 전제는 지적하고, 부적절한 요구는 거부할 수 있다.’는 겁니다. 이 글을 쓰는 현 시점에 다시 읽어 보면서도 이게 과연 기계에 대한 소개가 맞는지 의심스러울 지경입니다.
도대체 어디서 이런 엄청난 녀석이 튀어나온 걸까요?
기본적으로 ChatGPT는 GPT-3.5를 기반으로 합니다. (이 글을 보는 분이라면 이미 알고 있겠지만) GPT(Generative Pre-trained Transformer)는 OpenAI에서 개발한 자연어 생성 모델(Generative Language Model)이고요. 사실 GPT만 해도 처음 공개됐을 때부터 마치 사람이 쓴 것 같은 텍스트를 생성하며 놀라움을 안겨줬는데, GPT 3.5는 2018년 출시된 GPT-1보다 자그마치 1,500배 이상이나 많은 매개변수(parameter)를 사용하면서 비약적인 성능 향상을 이뤄냅니다.
그런데 GPT-3.5의 매개변수 수는 GPT-3와 같습니다. 이에 더해 인간 피드백을 통한 강화학습(Reinforcement Learning from Human Feedback, 이하 RLHF)을 사용함으로써 유의미한 차이를 만들어냈죠. 덕분에 사용자가 입력한 문장을 이해하고 답변을 생성해낼 뿐만 아니라, 실제 (각 해당 분야에 전문 지식을 가진) 사람과 대화하는 것처럼 자연스럽게 의사소통을 할 수도 있게 되었습니다.
이렇듯 RLHF 자체는 이미 GPT-3와 (ChatGPT의 바로 전 버전이자 자매 모델이라고 할 수 있는) InstructGPT에도 적용됐었습니다. InstructGPT는 그 이름처럼 인간의 지시에 따른 결과물을 만들어내도록 학습되었다는 점에서 오늘의 주인공 ChatGPT와 궤를 같이하고요. 다만 데이터 수집 방법 등 디테일에 있어 다소 차이가 있고, 바로 이 지점이 이전 세대 모델들과의 결정적인 차이를 만들어 낸 포인트입니다.
OpenAI는 이를 위해 학습용 데이터 수집부터 시작했습니다. 흔히 라벨러(Labeler)라고 불리는 인간 작업자들이 질문과 답으로 구성된 일종의 대본을 작성하게 한 거죠. 이렇게 만들어진 대화(답변) 형식의 데이터는 지도학습(Supervised Learning) 기반의 파인 튜닝(Fine-tuining)을 통해 기존 모델을 학습시키는데 사용하게 됩니다.
다음 단계에서는 비교군 데이터를 모으고, 보상 모델(Reward model) 학습을 진행합니다. 강화 학습을 위한 보상 모델을 만들려면 모델의 답변에 순위를 매길 수 있는 비교군 데이터가 필요하거든요. 이 데이터를 모으기 위해 프롬프트와 모델이 내놓는 답변들을 샘플링하고, 인간 작업자가 이에 대해 순위를 매기는 방식의 보상 모델을 활용하여 강화 학습을 진행하는 겁니다.
이후는 이러한 과정을 여러 차례 반복하는 방법을 사용하여 최종 결과물인 ChatGPT를 얻게 됩니다.
그래서 무엇을 할 수 있나?
OpenAI는 ChatGPT 서비스 웹페이지를 통해 사용 예시와 능력에 관해 설명하고 있습니다.
또한 실제로는 Q&A, 대화 생성 및 요약, 토론, 번역, 에세이나 시나리오 작성, 카테고리 분류, 프로그래밍 및 코드 오류의 교정 등 인간 못지 않게 폭 넓은 태스크를 수행할 수 있다고 알려져 있습니다. 게다가 최근 가장 핫 한 서비스인 만큼 이미 수 많은 사람들에 의해 다양한 테스트들이 이루어졌죠. 잠깐 인터넷 검색만 해보더라도 흥미로운 사례들이 쏟아져 나오는 것을 볼 수 있습니다.
그리고 이런 사례들을 몇 가지 살펴보면서 ChatGPT의 가장 큰 특징이자 잠재력은 대화라는 형식에 있다는 생각을 하게 되었습니다. (이전처럼 사용자가 적절한 프롬프트를 작성하지 못하더라도) 마치 사람과 대화하듯 연속적인 질문과 답변을 주고 받는 과정에서 더 나은 결과를 만들어 낼 수 있으니까요. 물론ChatGPT의 학습에 사용된 방법을 보면 당연하다고 볼 수도 있지만, 현재로서는 기계와 인간의 대화를 통해 의도한 대로 (어쩌면 기대 이상으로 잘) 기능하게 만든 것만 해도 대단히 인상적으로 느껴졌습니다.
한계 그리고 위험성은 없나?
ChatGPT가 이전보다 굉장히 진보된 모델이고, 놀라운 가능성을 보여줬다는 것은 분명합니다. 한편 여전히 기존 모델들이 보여준 문제점과 한계를 가지고 있기도 하죠. ChatGPT 웹페이지의 설명에서도 한계로서 부정확한 정보를 생성하거나(May occasionally generate incorrect information), 유해하고 편견이 있는 내용이 포함되거나(May occasionally produce harmful instructions or biased content), 세상에 대해 제한된 지식만 가지고 있음(Limited knowledge of world and events after 2021)을 밝히고 있습니다.
또한 언어 모델들이 공통적으로 가지고 있는 문제점인 Hallucination 역시 갖고 있습니다. 때때로 사실에 기반하지 않은 그럴듯한 문장들을 쏟아내는 거죠. 물론 실수를 인정하거나, 부정확한 것에는 이의를 제기하고 거절하는 등 이전 모델들보다 발전한 모습을 보여줬지만 이 문제점 역시 완전히 해결되지는 못한 것 같습니다.
그리고 이런 한계는 생각보다 상당히 심각한 위험성을 내포하고 있습니다. 이는 일부 학습 데이터에 존재하는 유해함과 편향 때문인데요. 현실적으로 당장 거대 모델의 학습에 사용되는 모든 데이터를 완벽하게 통제할 방법은 없기 때문입니다.
반면 무서울 정도로 엄청난 잠재력을 보여준 것 또한 사실입니다. 특히 대화를 통해 상호작용하며 태스크를 진행하는 방식은 인간과 기계의 협업을 연상시키죠. 우리가 협업을 통해 혼자 일할 때보다 더 나은 결과를 만들 수 있는 것처럼, ChatGPT는 기계와 협업을 통해 우리의 능력을 극대화할 수 있는 가능성을 보여줬다고 생각합니다.
영화 속 아이언맨은 인공지능 비서 자비스와 대화를 통해 바로 원하는 정보를 찾고, 함께 상의하며 문제를 해결하기도 합니다. 그런데 ChatGPT의 등장은 이런 영화 속 상상이 현실이 될 날이 멀지 않았음을 보여주었죠. 이런 추세라면 조만간 우리도 인공지능 비서와 대화를 하며 업무를 보고, 창작을 하고, 일상을 즐기고, … 이렇게 인류의 가능성을 극대화할 수 있지 않을까 기대해봅니다.
References
[1] https://openai.com/blog/chatgpt/
[2] https://en.wikipedia.org/wiki/ChatGPT
[3] https://www.zdnet.com/article/what-is-chatgpt-and-why-does-it-matter-heres-everything-you-need-to-know/
[4] https://www.nytimes.com/2022/12/10/technology/ai-chat-bot-chatgpt.html?fbclid=IwAR28GICw0xxPeywBRKrPks9RlROuQDlflBR7IUJBg9YMwXvcQr5SdtiLRSc
[5] https://www.theverge.com/23488017/openai-chatbot-chatgpt-ai-examples-web-demo
[6] https://towardsdatascience.com/openais-chatgpt-is-the-world-s-best-chatbot-a25fa9f54442
[7] https://www.moomoo.com/community/feed/109498321797125
[8] NIA THE AI REPORT (2023-1)
[9] https://www.donga.com/news/It/article/all/20230227/118085105/1