Gemma3から一年ぶりの新バージョン。
概要
基本情報
Gemma 4
Our most intelligent open models, built from Gemini 3 research.
| 正式名 | Gemma 4 |
| 公開日 | 2026年4月2日 |
| 開発会社 | Google DeepMind |
| モデル規模 | 31B (Dense) 26B MoE E4B E2B |
| ライセンス | Apache 2.0(商用利用OK) |
ライセンスがApache 2.0で商用利用が可能なのがいいですね。主な機能としてコーディング能力向上とエージェント用途、Function Calling(ツール連携)の強化がなされています。
AIエージェント向けての進化を感じられますね。
モデル別スペック
| パラメータ数 | 容量 | コンテキスト長 | コメント |
| E2B | GGUF(Q4): 4.4GB | 128K tokens | モバイル・エッジ向け 音声対応あり |
| E4B | GGUF(Q4): 6.3GB | 128K tokens | モバイル・エッジ向け 音声対応あり |
| 26B MoE | GGUF(Q4): 18GB | 256K tokens | 有効パラメータを抑えた高効率設計 |
| 31B Dense | GGUF(Q4): 19.9GB | 256K tokens | 最高性能モデル |
全モデルで動画をネイティブ処理でき、E2BとE4Bは音声入力にもネイティブ対応している。
このモデルを使った作例
ローカルLLMに長期記憶を持たせる
LM Studioに記憶を持たせたようなアプリを作成しました。
ノードベースのローカルLLMアプリ
文章をノードでつないでローカルLLMに文章生成させる、というアプリです。日本語表現が一段優れていると感じたGemma4を使うことにしました。
感想
自分が使っているのはこのLM-Studio Communityの31Bモデル。

lmstudio-community/gemma-4-31B-it-GGUF · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
まだ日本語の文章を書かせる等の使い方しかしていないので評価は難しいのですが、日本語の文章表現はQwen 3.5よりもよいと感じました。Qwen3.5に戻そうという気が起こらないぐらいによいです。文章の背後にある意図やニュアンスにまで配慮されている印象を受けました。
Qwenがプロプライエタリになりそうになっている中で、このような強力なオープンモデルが出てくる流れに安心しますね。
音声
動画と音声は後日レビューする予定です。画像は認識できたけど、音声のほうはまだ上手くいってません(現在Llama.cppがGemma 4に対応している真っ最中でもあります)。

