曲突徙薪(きょくとつししん)第7号

GPTを理解する 〜トランスフォーマーって何?〜

 米OpenAI社の「ChatGPT」をはじめとする生成AIの勢いが止まりません。先日は教育サービス大手のベネッセが、夏休みの自由研究のお題をAIが提案するサービスを発表しました。ChatGPTの登場からようやく半年が経ったところですが、ビジネスの世界のみならず、子どもたちの学習の現場までも一変させる技術として、いまではメディアで目にしない日がないほど注目されています。

(Photo by Alexander Sinn at Unsplash

 ChatGPTをはじめとする生成AIの技術にもとづくサービスの多くについては、サービスの具体的な利用方法の解説やレビュー、将来展望に関するレポートなど、すでにマスメディア、SNSを問わず情報で溢れかえっています。一方で、これらのサービスが新たに誕生した背景にある技術の具体的な内容を説明した記事は、専門的な技術資料を除くとあまり多くないようにも見えます。

 この「10年に一度のイノベーション」は、技術者でも学者でもない、私を含めた多くのビジネスパーソンにとっては、使う側の立場で最低限の知識を持っておけばそれで十分かもしれません。それでも、これを使いこなして、日々の仕事でより良い成果につなげるためには、あるいは新しい仕事にこれを活用するためには、技術的な背景について多少なりとも理解しておくことは、決してマイナスではないはずです。卑近な例にはなりますが、かつて自らがかかわった審査AIの開発当時も「畳み込みニューラルネットワーク(CNN)」の原理に触れたことが、具体的な技術の活用手段を考える上で大いに役立ちました。ここでは「ChatGPTはなぜ自然な会話ができるのか」という素朴な疑問に対して、技術面の厳密な理解を別にして、「それはね」と家庭や職場で答えられる程度の理解を目指して、限られた技術資料の中から簡単な説明を試みます。

 ただし、いくら簡単な説明といっても、GPT自体が難解かつ多岐にわたる技術の組み合わせで成り立っており、分量を縮めるにも限界があります。そこで今回は最初の取り組みとして、GPTの全体的な概要と、ChatGPTの技術の根幹をなす「トランスフォーマー」について、直感的に理解することを目指します。