戯言と技術 | M2 MacBook Air 24GBからM5 MacBook Air 32GBに乗り換え — OllamaでローカルLLMの性能を比較してみた

注意事項
本記事の内容は試験的な実装であり、アイデアベースの検証です
実務での利用を保証するものではありません
実装についての責任は負いかねます。自己責任でご利用ください
AIの出力結果は常に検証が必要です

M2 MacBook Air（24GB）からM5 MacBook Air（32GB）に乗り換えたので、ローカルLLMの性能がどれだけ変わるのか、Ollamaを使って実際にベンチマークしてみました。

テスト環境

テストに使用したモデルは以下の2つです:

プロンプトは両方とも同じ「ブログを作りたいので要件定義書を作って」で統一しました。

M2 MacBook Air 24GBでは、モデルのロードに20.4GiBが必要なのに対し、利用可能なメモリが17.3GiBしかなく、起動すらできませんでした。

Error: 500 Internal Server Error: model requires 20.4 GiB but only 17.3 GiB are available (after 512.0 MiB overhead)

M5 MacBook Air 32GBでは問題なく動作し、42.64 tok/sという実用的な速度で生成できました。体感的にもリアルタイムで文章が流れてくるレベルです。

指標	M2 MacBook Air 24GB	M5 MacBook Air 32GB	改善率
総実行時間	19分17秒	6分11秒	3.1倍高速
プロンプト評価速度	0.73 tok/s	3.66 tok/s	5.0倍
生成速度	2.67 tok/s	4.86 tok/s	1.8倍
生成トークン数	3,023 tokens	1,780 tokens	—

27Bモデルは両マシンで動作しましたが、性能差は歴然です。M2では生成速度が2.67 tok/sと、1秒に2〜3トークンしか出力されないため、長い回答を待つのがかなり辛い状況でした。M5では4.86 tok/sと約1.8倍に向上し、待ち時間が大幅に改善されました。

特にプロンプト評価速度（入力の処理速度）は0.73 tok/s → 3.66 tok/sと5倍の改善で、応答開始までの待ち時間が大きく短縮されています。

興味深いことに、同じプロンプトに対して両モデル・両マシンとも「ブログ要件定義書のテンプレート」を生成しましたが、出力のスタイルに違いがありました。

M2からM5への乗り換えで得られた最大のメリットは以下の3点です:

ローカルLLMを日常的に使う場合、メモリ容量とチップ性能の両方が重要です。特に32GB以上のメモリは、実用的なサイズのモデルを動かすための最低ラインと言えるでしょう。M5 MacBook Airは、ローカルAI用途においてコストパフォーマンスの高い選択肢です。