生成AI最前線第8回 賢いだけでは足りない? 速く、軽く、省エネに進化する生成AI

生成AIのニュースでは、よく「前より賢くなった」「難しい問題が解けるようになった」という点が注目されます。

もちろん、AIの性能が上がることは重要です。
ですが、生成AIが社会の中で広く使われるようになるほど、別の観点も出てきます。

生成AIに求められるものが変わってきた

これまで生成AIの進化は、主に「どれだけ高品質な答えを出せるか」で語られてきました。

文章が自然か。
正確に答えられるか。
難しい推論ができるか。
プログラムを書けるか。

こうした能力は、もちろん大切です。

ですが、実際に仕事や生活の中で使うことを考えると、それだけでは足りません。

毎回返事が遅ければ、作業の流れが止まります。
巨大なサーバーでしか動かないなら、使える場面は限られます。
大量の電力を使うなら、社会全体の負担も大きくなります。

つまり、これからのAIには「賢さ」だけでなく、「使い続けられる効率」も求められているのです。

「速く生成する」研究

その一例が、Googleが公開したDiffusionGemmaです。

DiffusionGemmaは、文章をより速く生成することを目指した実験的なAIです。
一般的な生成AIは、文章を先頭から一語ずつ順番に作っていきます。
それに対して、このAIは、文章のまとまりを先に同時に作り、少しずつ全体を整えていくような仕組みになっています。

つまり、これまでのAIが「一語ずつ順番に書く」方式だとすれば、DiffusionGemmaは「全体の下書きを先に作ってから整える」方式と言えます。

Googleは、この仕組みによって、最大で4倍速くテキスト生成が可能だと説明しています。

ここで重要なのは、単にモデルを大きくしたというわけではないことです。
文章の作り方そのものを変えて、より速く、効率よく動かそうとしたのです。

「計算を軽くする」研究

効率化の研究は、Googleだけではありません。

中国発のDeepSeekやQwenなどでは、巨大なAIモデルの中から、必要な部分だけを動かす仕組みが使われています。
これはMoEと呼ばれる考え方です。

例で考えてみましょう。

冷蔵庫にたくさんの食材が入っています。
でも、料理をするときに全ての食材を取り出したりはしないですよね?
とんかつを作るなら、豚肉、卵、キャベツなど、必要なものだけを取り出します。

MoEもそれに近い仕組みです。
巨大なモデル全体を毎回動かすのではなく、必要な部分だけを動かします。
これも、AIを効率よく使うための重要な方向です。

「省エネで動かす」研究

大きくする研究があるなら、小さくする研究もあります。

MicrosoftやGoogle、あるいはAppleなどは、スマホや会社のPCでも動くような、とてもコンパクトなAIの研究もしています。
これらの環境では、電力(電池)が限られていたり、巨大なメモリを搭載できないなど、環境的な制約があります。

以前の記事でも触れたように、大規模な生成AIを支えるには、データセンターのような大量の計算資源(GPUやメモリなど)と電力が必要でした。
ですが、スマホやPCでは、そのようなリソースは用意できません。
AIを使ったらスマホのバッテリーが1時間しか持たないなんて、使い勝手が悪いですよね?
スマホで動かすには、スマホの環境に適合した、「省エネ」なAIも必要なのです。

まとめ

生成AIの進化は、賢さだけではありません。

速く生成できること。
計算を軽くすること。
省エネ環境でも使えること。

一見地味に見えるこうした性能が、これからのAIではますます重要になります。
そしてそれは、いずれ、AIを社会の中で使い続けるための条件になっていきます。

AIが日常や仕事に本当に根づくためには、「高性能」だけでなく、「使い続けられる効率」も欠かせないのです。