MENU

検証 ChatGPT ~IBM i開発・運用へのアプローチ ❶ ChatGPT・生成AIのイノベーション

本誌の姉妹メディアであるメルマガ「i Mag Mail」が4月初めに行ったChatGPTに関するアンケートでは、回答78名のうち約7割が「大いに関心がある」、2割が「IBM iの開発・運用などでChatGPTを試しに使ったことがある」という結果だった。それから約4カ月、さらに多くのIBM iユーザーがChatGPTを体験し、テクノロジーの進化を実感していることとと思われる。

ChatGPTが凄いと感じられるのは、ふつうの言葉(口語体)で質問すると、そのニュアンスも含めて解釈し、“物知り博士”が答えるように完璧な(と思える)回答をごく自然な言葉で返してくるところだ。さらに質問を変えても同様に、“物知り博士”のような答えが返ってくる。

こうした何もないところからテキストを生成する新しいAI技術を「生成AI(ジェネレーティブAI)」と呼ぶ。現在はChatGPTのような言語系が突出しているが、画像系や音声系の生成AIも研究が進んでいる。

生成AIは、1950年代からのAIの歴史に連なる最先端の技術である(図表1)。その約10年前にブレークしたディープラーニング(深層学習)は、脳の神経細胞の構造を模したニューラルネットワークによって大量のデータから特定の問題(タスク)を解くAI技術で、大量の画像を学習して特定の画像を見分ける画像分類や、大量の音声データを学習して音声を聞き分ける音声分類などさまざまな分野で適用が進んでいることは周知のとおりだ。

図表1 AIの発展史に連なる生成AI
図表1 AIの発展史に連なる生成AI

これに対して生成AIは、単一のAIモデルでありながら多様なタスクを処理できる(図表2)。ChatGPTならChatGPTという単一のAIモデルで、「3日間のパリ旅行のおすすめプランは?」や「RPG ⅢとRPG Ⅳの違いを教えて」といった多様な質問(タスク)を投げても内容を解釈し、詳細な(と見える)回答を自然な言葉で返してくる。

図表2 生成AIの基本的な仕組み
図表2 生成AIの基本的な仕組み

ChatGPTがこうした処理を行えるのは、大規模言語モデル(Large Language Model、LLM)による解析が可能になったからと言われる。大規模言語モデルとは、多様なデータソースから大量のテキストデータを収集・学習して言葉と言葉の関連づけや重みづけを行い、多数のパラメータを持つニューラルネットワークとして構成した言語モデルのことである。

この言語モデルを採用したシステムに質問を投げると、質問を1つ1つの単語や言葉の断片(トークン)に分割し、さらに分割した各トークンの次に来るべきトークンを推定してトークンの連なりを作り、その繰り返しによって質問に最も近しい回答を導くという処理を行う。これが多種多様な質問(タスク)にも柔軟に対応し、それぞれに最適な回答を返せる理由である。

大規模言語モデルはパラメータ数が多いほど、精度の高い回答を出す。昨年(2021年)11月発表のChatGPTのパラメータ数は3550億個(GPT-3.5)だったが、4カ月後の今年3月に発表されたGPT-4は5000億〜1兆個と推定されている(図表3)。このパラメータ数の拡大・増加は日進月歩で、他社の生成AIもパラメータの拡大を急ピッチで進めている(他社の生成AIには、言語系のBard、画像系のStable Diffusion、音声系のVALL-E、動画系のMake-a-Video、Phenakiなどがある)。そしてこうした性能向上によって、従来のAIでは実現できなかったタスクの処理が可能になると考えられ始めている(図表4)。 

図表3 GPTシリーズのデータ量の変遷
図表3 GPTシリーズのデータ量の変遷
図表4 生成AIで可能になるタスク、従来からできるタスク
図表4 生成AIで可能になるタスク、従来からできるタスク

IBMが生成AI時代に推進する
3つの特徴を備えるwatsonx

IBMが5月に発表したwatsonxは、生成AIの特性を備える「ビジネスに特化したAI」である。特徴は、生成AIの「基盤モデル」(図表2中央)に3種類のAIモデルを提供していること。その3種類とは、IBMが事前学習を実施した「IBMモデル」(コード生成、大規模言語モデル、地理空間データなど)と、Hugging Face社との連携による「オープンソース・モデル」、ユーザーが自社固有のモデルを開発できる「独自モデル」の3つである。これによりビジネスの用途にあわせた多様な処理が可能になるという(図表5の「watsonx.ai」)。

watsonxの2つ目の特徴は、データがオンプレミスやクラウド上のどこにあってもアクセスでき、複数のクエリーエンジン(Db2、Spark、Netezza、Presto)の使い分けによってデータを効率的に抽出・保管できるという点である(「watsonx.data」で実現)。そして3つ目は、AIライフサイクルの全体を統制しAI倫理基準を満たすための仕組みをもつ「watsonx.governance」である。

図表5 3つの特徴をもつwatsonxの概要
図表5 3つの特徴をもつwatsonxの概要

IBMではwatsonxを「今後すべてのソフトウェア製品に適用していく」ことを表明している(図表6)。ちょうどRed Hatの買収後にソフトウェア製品を一斉にコンテナ化(Kubernetes、OpenShift対応)したような動きが、今後進んでいくものと思われる。IBM i分野でもwatsonxがより近しいものになることが期待される。

図表6 IBMはwatsonxをすべてのIBM製品に適用する
図表6 IBMはwatsonxをすべてのIBM製品に適用する

一方、サードベンダーのほうでは、オランダのRemain SoftwareがRDi用のChatGPTプラグイン「AiChat」を5月にリリースした。RDiを使ったコーディングやドキュメント作成を支援するAIチャットボットで、「コンテキストに応じたフリーフォームRPGのコーディングの提案や、コードスニペットやバグチェック、ドキュメントの提案などをより速く、より効率的に行える」とリリースは記している。無料で利用でき、GitHubで公開されている。

また国内では、三和コムテックがRPAツール「AutoMate」のAPI連携機能を使ってタスクの一部にChatGPTを組み込めることを検証し、ユーザーに利用を推奨している。連携例として、ChatGPTを使ってテキストデータから情報を抽出し、抽出した情報をAutoMateからIBM iへ入力し、自動処理することなどを挙げている。

ChatGPTを利用したユースケースも徐々に増えつつある。ChatGPTを含めた生成AIの利用を検討してみる時期にきているように思える。

[i Magazine 2023 Summer(2023年8月)掲載]

新着