USB一つにAIを詰め込んだ – LG EXAONE 3.5 韓国語最強小型モデル 実践レビュー
インストール不要、インターネット不要、USBを挿せばAIが答える
「AIを使うならChatGPTにアクセスしないと。」
ほとんどの人はまだAIをクラウドサービスとしてしか考えていません。毎月購読料を払い、インターネットに接続する必要があり、自分のデータがサーバーにアップロードされる構造。しかし、もしUSB一つ挿すだけで自分のコンピュータで直接AIが動作するとしたら?
今日紹介するのはLG EXAONE 3.5 2.4BとMozillaのllamafileの組み合わせです。MONKOS AIで直接テストした実践レビューを共有します。
EXAONE 3.5 — LG AI Researchの韓国語特化小型モデル
LG AI Researchが開発したEXAONE(Expert AI for everyONE) 3.5は2.4B(24億)パラメータの小型言語モデルです。「小型」という言葉に騙されてはいけません。韓国語性能は同クラス最強です。
ベンチマーク比較 (2.4~3B級)
| ベンチマーク | EXAONE 3.5 2.4B | Qwen 2.5 3B | Gemma 2 2B | Llama 3.2 3B |
|---|---|---|---|---|
| KoMT-Bench | 7.24 | 5.68 | 4.83 | 3.16 |
| LogicKor | 8.51 | 5.21 | 5.29 | 2.86 |
| KMMLU | 45.8 | 41.7 | 37.4 | 35.0 |
| Ko-LongRAG | 74.7 | 40.5 | N/A | 39.3 |
KoMTベンチマークで2位と27%の差、LogicKorでは63%の差。韓国語の質問に対する理解度と応答品質が圧倒的に高いです。特にKo-LongRAG(長文ドキュメントベースQA)で74.7点は、長い文書を読んで正確に答える能力が卓越していることを意味します。
llamafile — ダブルクリック一回で完了
Mozillaが開発したllamafileは、LLM推論エンジンを単一の実行ファイルとしてパッケージングするプロジェクトです。
- インストール不要 — .exe(Windows)またはバイナリ(Mac/Linux)一つ
- クロスプラットフォーム — 同じファイルがWindows、macOS、Linuxで動作
- Web UI内蔵 — 実行するとブラウザで直接チャット可能
- CPUのみで動作 — GPUがなくてもOK (あればより高速)
llamafile(721MB) + EXAONE GGUFモデル(1.64GB) = 合計2.3GB。USB一つに十分収まるサイズです。
実践テスト — 事業提案書を丸ごと注入して質問した
単純な「こんにちは」テストではありません。MONKOS AIで実際に行ったテストです。
テスト環境
- モデル: EXAONE-3.5-2.4B-Instruct-Q4_K_M
- エンジン: llamafile v0.10.0
- ハードウェア: Intel i5, 8GB RAM (一般的な事務用PCレベル)
- 入力: システムプロンプトに事業概要 + 技術スタック + 財務データ 約10,000トークン注入
実際の質疑応答結果
Q: 「この課題の中核技術は何ですか?」 → 3段階パイプライン(リアルタイムコーチング → AI生成 → 品質検証)を正確に説明。提案書に記述された内容を自分の言葉で再構成して回答。
Q: 「GPUがなぜ必要なのですか?」 → Imagenモデルのリアルタイム生成要求事項、バッチ処理 vs リアルタイム推論の違いを説明。技術的な文脈を理解した応答。
Q: 「事業化戦略は具体的に何ですか?」 → 3ヶ国語サービス構造、クレジット課金モデル、B2B拡張戦略まで提案書の文脈に合った回答。
合計8件の質問でハルシネーション(hallucination) 0件。提案書にない内容を捏造せず、知らないことは知らないと答えました。2.4Bという小さなモデルがこの程度の品質であれば、十分に実務に活用可能です。
応答速度
- モデルローディング: 約8秒
- 最初のトークン(TTFT): 3~5秒
- 生成速度: 約10 tok/s
- 一文完成: 3~5秒
ChatGPTのように即座に応答しませんが、オフラインでこの程度なら実用的です。
ChatGPT・Geminiと何が違うのか
| 項目 | クラウドAI (ChatGPTなど) | オンデバイスAI (EXAONE) |
|---|---|---|
| インターネット必要 | ✅ 必須 | ❌ 不要 |
| データ転送 | サーバーへ転送 | 自分のPCでのみ処理 |
| 費用 | 月 $20~200 | 無料 |
| 性能 | 非常に高い | 韓国語特化 (同クラス最強) |
| インストール | アカウント作成必要 | USB挿してダブルクリック |
最も重要な違いはセキュリティと費用です。事業提案書、財務データ、人事情報のような機密文書をクラウドにアップロードするのはリスクがあります。オンデバイスAIはデータが自分のコンピュータから離れません。
どこに使えるのか
- 中小企業・個人事業主の現場 — PTやミーティングでUSBを挿してすぐにAIデモ。Wi-Fiのない環境でも動作。
- 教育現場 — 学校・塾でインターネット遮断環境でもAI授業が可能。
- セキュリティ機密環境 — 軍事、金融、医療など外部ネットワーク遮断環境でAI活用。
- 費用重視の環境 — 購読料なしで無制限にAI活用。小規模チームに最適。
結論 — 2GB USBが秘書になる時代
LG EXAONE 3.5 + llamafileの組み合わせは「AIはクラウドにしかない」という固定観念を打ち破ります。
- 2.3GBのUSB一つに韓国語最強AIが詰まっています
- インストール不要、ダブルクリックで開始
- インターネット不要、完全オフライン動作
- 費用不要、無料永久使用
「自分だけのAI秘書」がポケットの中のUSBにある時代。すでに技術的に可能です。
MONKOS AIは20年のキャリアを持つ写真家が作ったAI証明写真プラットフォームです。 AI技術を実際のサービスに適用する過程をブログで共有しています。