最近、人工知能シーンで最も話題になっているのはChatGPTです。 多くの人々が存在くらいは知っていて、実際に使用している人も結構多いということです。 そのおかげで全世界的の業界はもちろん、期待と共に憂慮する声も上がっています。
ユニークで凄まじい存在感
3.5年、2.5年、10ヵ月、5ヵ月、2.5ヵ月······
上記は順番にネットフリックス(Netflix)、フェイスブック(Facebook)、スポティアイ(Spotify)、インスタグラム(Instagram)が100万ユーザーを達成するまでにかかった期間です。 しかし、先日にこれらのそうそうたるサービスの記録を一気に塗り替えた新しいスーパースターが登場しました。 発売5日でこれらを飛び越えてしまったOpenAIのChatGPTです。
それでは、人々はなぜここまでChatGPTに熱狂するのでしょうか?
もちろん、誰でも簡単にチャットサービスのように利用できるように無料公開したおかげで、ソーシャルメディアを通じてバイラルが活発に起きた理由もあります。 それでも(急速に変化するこのシーンで)発売から3ヶ月が経った現時点で、未だに熱い注目を浴びているのは凄まじいことです。 一体どんなすごいヤツでこのように注目を集めているのか、どのように活用して、どのような影響を及ぼすのか、一つ一つ調べてみましょう。
ヤツが知りたい
まず、ChatGPTを公開したOpenAIブログの紹介文から確認してみます。
We've trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests.
OpenAIの説明のように、ChatGPTはユーザーと対話するように相互作用できるように訓練された一種の言語モデルです。 一見、単なるチャットボットのように感じられるかもしれませんが、ヤツの真骨頂はその次の文章で確認できます。すぐに対話を通じて「続く質問に答え、返事のミスを認め、誤った前提は指摘し、不適切な要求は拒否できる。」ということです。 この文章を書く現時点でもう一度読んでみても、これが果たして機械に対する紹介なのか疑わしいほどです。
一体どこからこんなすごいヤツが飛び出してきたんでしょうか?
基本的にChatGPTはGPT-3.5に基づいています。 (この文章をご覧になっている方なら既にご存知だと思いますが)GPT(Generative Pre-trained Transformer)はOpenAIで開発した自然言語生成モデル(Generative Language Model)です。 実はGPTが初めて公開された時からまるで人が書いたようなテキストを生成して驚きを禁じ得なかったのです。GPT3.5は2018年に発売されたGPT-1より、1,500倍以上も多くのパラメータ(parameter)を使用しながら飛躍的な性能向上を成し遂げます。
ちなみにGPT-3.5のパラメータ数はGPT-3と同じです。 これに加えて、人間フィードバックによる強化学習(Reinforcement Learning from Human Feedback、以下RLHF)を使用することで、有意義な違いを生み出しました。 おかげで、ユーザーが入力した文章を理解し、回答を生成するだけでなく、実際に(各分野に専門知識を持った)人と会話をしているかのように自然にコミュニケーションを取ることも出来るようになりました。
このように、RLHF自体は既にGPT-3と(ChatGPTの直前バージョンであり、姉妹モデルともいえる)InstructGPTにも適用されていました。 Instruct GPTは、その名のように人間の指示に従って結果を作り出すように学習されたというところで今日の主人公Chat GPTと似たようなものだとも言えます。 ただし、データ収集方法などディテールにおいては多少の差があり、これが旧世代のモデルとの決定的な違いを生み出したポイントです。
OpenAIは学習用データ収集から始めました。 よくラベラー(Labeler)と呼ばれる人間作業者たちが質問と答えで構成された一種の台本を作成させたのです。 このようにして作られた対話(返答)形式のデータは、教師あり学習(Supervised Learning)基盤のファインチューニング(Fine-tuining)を通じて既存モデルを学習させるのに使用されます。
次のステップでは比較データを収集し、報酬モデル(Reward model)の学習を行います。 強化学習のための報酬モデルを作るには、モデルの回答に順位をつけることができる比較データが必要です。 このデータを収集するためにプロンプトとモデルが出す回答をサンプリングし、人間の作業者がこれに対して順位を付ける方式の報酬モデルを活用して強化学習を進めるのです。
その後は、このような過程を何度も繰り返し、最終結果物であるChatGPTができました。
それで何ができるのか?
OpenAIはChatGPTサービスのウェブページを通じて使用例と能力について説明しています。
また、実際にはQ&Aや会話の生成と要約、討論、翻訳、エッセイ、シナリオの作成、カテゴリー分類、プログラミング、コードエラーの訂正などと人間に劣らず幅広いタスクを実行できることが知られています。 しかも、最近最も人気なサービスであるだけに、既に多くの人によって様々なテストが行われました。 インターネット上でサラッと検索してみるだけでも興味深い事例があふれ出ることが分かります。
そして、このような事例をいくつか見てみると、ChatGPTの最大の特徴であり、潜在力は対話という形式にあると考えるようになりました。 (以前のようにユーザーが適切なプロンプトを作成できなくても)まるで人と会話するように連続的な質問と回答を交わす過程でより良い結果を作り出すことができるからです。 もちろんChatGPTの学習に使われた方法を見れば当然なことだと思えるかもしれませんが、現在としては機械と人間の会話を通じて意図したとおりに(もしかしたら期待以上によく)機能するように作っただけでも非常に印象的に感じました。
限界、そして危険性はないのか?
ChatGPTが以前より非常に進歩したモデルであり、驚くべき可能性を示したことは明らかです。 一方、依然として既存モデルが見せてくれた問題点と限界を持っていることもあります。 ChatGPTウェブページの説明でも限界として不正確な情報を生成したり(May occasionally generate incorrect information)、有害で偏見のある内容が含まれたり(May occasionally produce harmful instructions or biased content)、世の中に対して制限された知識だけを持っている(Limited knowledge of world and events after 2021)ことを明らかにしています。
また、言語モデルが共通して持っている問題点であるHallucinationも持っています。 時々、事実に基づいていないもっともらしい文章を吐き出すのです。 もちろん、ミスを認めたり、不正確なことには異議を唱えて断るなど、以前のモデルより発展した姿を見せたのですが、この問題点もやはり完全に解決はできていないようです。
そして、このような限界は思ったよりかなり深刻な危険性を内包しています。 これは、一部の学習データに存在する有害さと偏向のせいです。 現実的にはすぐ巨大モデルの学習に使用されるすべてのデータを完全に制御する方法はないからです。
反面、恐ろしいほど途方もない潜在力を見せてくれたことも事実です。 特に、対話を通じて相互作用し、タスクを進める方式は人間と機械の協業を連想させます。 私たちが協業を通じて一人で働く時より良い結果を作り出せるので、ChatGPTは機械と協業を通じて私たちの能力を極大化できる可能性を見せてくれたと思います。
映画の中のアイアンマンはAI秘書ジャービスと会話で欲しい情報をすぐに得たり、AI秘書に相談して問題を解決することもあります。 ところでChatGPTの登場はこのような映画の中の想像が現実になる日も遠くないことを示してくれました。 このままだと、近いうちに私たちもAI秘書と会話をしながら仕事をし、創作をし、日常を楽しんで… このように人類の可能性を極大化できるのではないかと期待してみます。
References
[1] https://openai.com/blog/chatgpt/
[2] https://en.wikipedia.org/wiki/ChatGPT
[3] https://www.zdnet.com/article/what-is-chatgpt-and-why-does-it-matter-heres-everything-you-need-to-know/
[4] https://www.nytimes.com/2022/12/10/technology/ai-chat-bot-chatgpt.html?fbclid=IwAR28GICw0xxPeywBRKrPks9RlROuQDlflBR7IUJBg9YMwXvcQr5SdtiLRSc
[5] https://www.theverge.com/23488017/openai-chatbot-chatgpt-ai-examples-web-demo
[6] https://towardsdatascience.com/openais-chatgpt-is-the-world-s-best-chatbot-a25fa9f54442
[7] https://www.moomoo.com/community/feed/109498321797125
[8] NIA THE AI REPORT (2023-1)
[9] https://www.donga.com/news/It/article/all/20230227/118085105/1