IBMは10月21日(現地時間)、年次イベント「TechXchange」で、AIモデル・ファミリーであるGranite の最新バージョン3.0を発表した。
GraniteはIBMが開発した大規模言語モデルであり、同社の主力製品である。Granite 3.0ファミリーには大きく3つのモデルがあり、以下が含まれる。いずれもApache 2.0ライセンスの下、オープンソースソフトウェア(OSS)として公開される。
◎一般用モデル
Granite 3.0 2B Instruct、Granite 3.0 8B Base、Granite 3.0 2B Base
◎入出力用ガードレールモデル
Granite Guardian 3.0 8B、Granite Guardian 3.0 2B
◎混合モデル
Granite 3.0 3B-A800M Instruct、Granite 3.0 1B-A400M Instruct、Granite 3.0 3B-A800M Base、Granite 3.0 1B-A400M Base
Granite 3.0には、上記のように複数のバリエーションがあるが、なかでも注目されるのはGranite 3.0 8B である。日本語を含む12種類の自然言語と116種類のプログラミング言語から収集された12兆トークンを超えるデータを利用して、データ品質、データ選択、学習パラメータ最適化するために設計された数千の実験結果を活用した新しい2段階学習法を用いて学習されている。年末までに、Granite 3.0 8Bおよび2B言語モデルは、拡張された128Kのコンテキスト長とマルチモーダル文書理解機能をサポートする予定である。
新しいGranite 3.0 8Bおよび2B言語モデルは、エンタープライズAI向けの主力モデルとして設計されており、検索拡張生成(RAG)、分類、要約、エンティティ抽出、ツール使用などのタスクを提供する。これらのモデルは、企業データで微調整し、多様なビジネス環境やワークフローにシームレスに統合できるように設計されている。
多くの大規模言語モデルが企業データの大部分を活用できていないとIBMは指摘しており、IBMとRed Hatが今年5月に発表した「InstructLab」を活用すれば、小規模なGraniteモデルを企業データと組み合わせることで、企業は大規模なモデルに匹敵するタスク固有のパフォーマンスを低コストで達成できると考えているようだ。
◎InstructLab
IBM ResearchとRed Hatによって開発されたオープンソースプロジェクトで、生成AI、特に大規模言語モデルのカスタマイズとチューニングを効率的に行うためのプラットフォーム
Granite 3.0のベンチマーク結果
Granite 3.0言語モデルは、基本性能評価で有望な結果を示している。
Hugging FaceのOpenLLM Leaderboardによって定義された標準的な学術ベンチマークで、Granite 3.0 8B Instructモデルの全体的な平均性能は、MetaやMistralの同規模の最先端のオープンソースモデルを上回った。
IBMの最先端のAttaQ安全性ベンチマークでは、Granite 3.0 8B Instructモデルは、MetaやMistralのモデルと比較して、測定した安全性のすべての基準で上回っている。
IBMはまた、今年初めに最初のバージョンが発表された、事前学習済みのGranite時系列モデルの更新版を発表した。これらの新しいモデルは、3倍以上のデータで学習され、3つの主要な時系列ベンチマークすべてで、GoogleやAlibabaなどが提供する10倍以上のサイズのモデルを上回る性能を発揮している。
また今回のリリースの一環として、アプリケーション開発者がユーザーのプロンプトや大規模言語モデルの応答を、さまざまなリスクの観点から確認することで安全対策を導入できるGranite Guardianの新シリーズも発表している。
社会的偏見、憎悪、攻撃性、冒涜、暴力、ジェイル・ブレイキングなどの有害性に加えて、これらのモデルは、根拠、文脈の関連性、回答の関連性といったRAG特有のチェックも提供する。
19の安全性とRAGベンチマークにわたる広範なテストで、Granite Guardian 3.0 8Bモデルは、MetaのLlama Guardモデルの3世代すべてよりも、有害性検出において全体的に高い平均精度を示した。また、ハルシネーション検出でも、このタスクに特化したモデルであるWeCheckやMiniCheckと比較して、平均して同等の総合的な性能を示した。
「watsonx Code Assistant」の次期リリースを発表
IBMは同日、Graniteコードモデルを搭載し、C、C++、Go、Java、Pythonなどの言語に対する汎用的なコーディング支援やエンタープライズJavaのアプリケーション・モダナイゼーション機能を提供する「watsonx Code Assistant」の次期リリースも発表した。
これにより、Graniteのコード機能は、Visual Studio Codeの拡張機能であるIBM Granite.Codeからもアクセスできるようになる。
RPGのコードを自動生成すると期待されているRPG Code Assistantも、大規模言語データベースとしてGraniteコードモデルを使用している。
[i Magazine・IS magazine]