3大AI バージョン別進化年表
ChatGPT / Claude / Gemini — 各バージョンで何ができるようになったか(2022〜2026)
2022年11月
GPT-3.5初代ChatGPT
テキストのみ。質問に答える、文章を書く、翻訳する。2ヶ月で1億ユーザー突破。パラメータ数1,750億。コンテキスト16Kトークン。
世界を変えたテキスト生成翻訳コード生成
2023年3月
GPT-4大幅性能向上
画像入力に対応(マルチモーダル化の第一歩)。推論能力が大幅向上。司法試験で上位10%のスコア。コンテキスト128Kトークン。パラメータ約1兆。
画像理解推論力向上プラグイン対応Code Interpreter
2023年11月
GPT-4 Turbo高速化&低コスト
GPT-4の高速・低コスト版。知識が2023年4月まで更新。カスタムGPTs(自分専用AIを作れる)登場。JSON出力モード追加。
3倍安価カスタムGPTsJSONモード
2024年5月
GPT-4oマルチモーダル統合
テキスト・音声・画像をリアルタイムで処理。音声会話が自然に。無料ユーザーにも開放。GPT-4より2倍高速・半額。「o」= omni(全方位)。
マルチモーダル元年リアルタイム音声無料開放2倍高速
2024年7月
GPT-4o mini軽量・超低コスト
GPT-4oの小型版。GPT-3.5 Turboを全面的に置き換え。非常に安価ながらGPT-4レベルの性能。開発者向けの主力モデルに。
超低コストGPT-3.5置換
2024年9月
o1推論特化モデル
「考えてから答える」推論モデルの登場。数学・科学・コーディングで飛躍的性能向上。回答前に内部で段階的に思考する(Chain of Thought)。
推論AI元年段階的思考数学・科学特化
2025年1月
o3-mini推論モデル小型版
o1の後継となる推論モデルの小型版。高速かつ低コストで強力な推論を実現。
推論高速・低コスト
2025年4月
o3 / o4-mini推論モデル本格版
o3はフルサイズの推論モデル。o4-miniは超高速・低コストの推論特化。数学・コーディング・視覚タスクで圧倒的性能。
高度推論視覚推論コスト効率
2025年6月
GPT-5統合フラッグシップ
GPTシリーズとoシリーズを統合した「一つのAI」。アプリ開発、コード生成、エージェント的行動が可能に。Auto/Fast/Thinkingモードを切替可能。
GPT+o統合エージェント機能モード切替
2025年12月
GPT-5.2コーディング強化
Codex特化版も登場。Google Gemini 3との競争で急遽リリース("Code Red"と報道)。
コーディング強化Codex統合
2026年3月
GPT-5.4現在の最新モデル
推論・コーディング・エージェントの集大成。100万トークンのコンテキスト。GPT-5.2比でエラー33%減。Pro版はプロフェッショナル向け最高性能。CarPlay対応。
最新100万トークンエラー33%減CarPlay
ChatGPTの歩み:テキストのみ → 画像理解 → マルチモーダル → 推論 → エージェント → 全統合
2023年3月
Claude 1招待制で公開
Anthropic初のAI。招待制のみで利用可能。「安全で有用なAI」をコンセプトに開発。テキストのみ対応。
安全性重視テキスト生成
2023年7月
Claude 2一般公開
初の一般公開モデル。コンテキスト100Kトークン(約75,000語)。コーディング・数学能力が向上。
一般公開100Kコンテキストコーディング向上
2023年11月
Claude 2.1長文理解の王
コンテキスト200Kトークン(約500ページ分)に倍増。ハルシネーション(知ったかぶり)が大幅減少。
200Kトークンハルシネーション減
2024年3月
Claude 3 ファミリーOpus / Sonnet / Haiku
3サイズ展開を開始。Opus(最高性能)/ Sonnet(バランス)/ Haiku(高速・低コスト)。画像理解(ビジョン)に初対応。
3サイズ体制画像理解Opus/Sonnet/Haiku
2024年6月
Claude 3.5 Sonnet衝撃のコスパ
Sonnet(中位モデル)なのにOpus(最上位)を超える性能。開発者の間で爆発的に普及。SWE-benchで業界トップ。Artifacts(画面内プレビュー)機能追加。
Opus超えコーディング最強Artifacts
2025年2月
Claude 3.7 Sonnet思考モデル
「拡張思考」(Extended Thinking)に初対応。回答前にステップバイステップで考える能力を獲得。Claude Code同時リリース。
拡張思考Claude Code登場
2025年5月
Claude 4 (Sonnet & Opus)次世代モデル
推論能力が大幅向上。エージェント用途に最適化。Claude 4 Opusは最も高度な推論を提供。
推論大幅向上エージェント最適化
2025年9月
Claude Sonnet 4.5コーディング世界最強
SWE-bench Verified 77.2%で歴代最高スコア。「世界最高のコーディングモデル」「世界最高のエージェントモデル」と公式が宣言。100万トークンのコンテキスト対応(ベータ)。
SWE-bench最高100万トークンエージェント最強
2025年10月
Claude Haiku 4.5高速モデル刷新
軽量・高速モデルが大幅進化。旧Sonnet 4.0並みの推論力を持ちつつ高速。日常の質問や要約に最適。
Sonnet 4並み性能高速
2025年11月
Claude Opus 4.5最高峰モデル
最も高度な推論・分析能力。「effortパラメータ」で思考の深さを調整可能。複雑なタスクや研究用途に。
最高推論力effort調整
2026年1月
Cowork 登場非エンジニア向けエージェント
Claude Codeのパワーをデスクトップアプリから。プログラマーでなくてもAIに仕事を丸ごと任せられるように。フォルダ指定でファイル操作、ドキュメント自動生成。
全ての人にAIエージェントをデスクトップ統合
2026年2月
Opus 4.6 / Sonnet 4.6現在の最新モデル
エージェント検索性能向上、トークン効率改善。100万トークンコンテキストが正式版に。出力上限300Kトークン。MicrosoftのCopilot Coworkとも連携(3月発表)。
最新100万トークン正式版Microsoft連携出力300K
Claudeの歩み:安全なテキストAI → 長文特化 → 3サイズ展開 → コーディング最強 → エージェント化(Cowork)
2023年12月
Gemini 1.0Ultra / Pro / Nano
Googleの本格的なマルチモーダルAI。Ultra/Pro/Nanoの3サイズ。Ultraは人間の専門家をMMLUテストで初めて超越(90%)。Bard → Geminiにブランド統合。
Google本格参入マルチモーダル3サイズMMLU人間超え
2024年2月
Gemini 1.5 Pro100万トークンの衝撃
100万トークンのコンテキストウィンドウ(業界初)。Mixture-of-Experts(MoE)アーキテクチャ採用。1.0 Ultraを超える性能をPro価格で実現。
100万トークン(業界初)MoEアーキテクチャUltra超え性能
2024年5月
Gemini 1.5 Flash高速・低コスト版
Proの知識を蒸留した軽量・高速版。コンテキスト32K。低コストで大量処理に最適。開発者向けの主力モデルに。
Flash登場軽量・高速低コスト
2024年12月
Gemini 2.0 FlashリアルタイムAI
1.5 Flashの2倍高速で同等品質。リアルタイム音声・映像対話API。ネイティブ画像生成・音声合成。Google検索統合。
2倍高速リアルタイム対話画像・音声生成検索統合
2025年2月
Gemini 2.0 Proフルサイズ版
Gemini 2.0のフルサイズモデル。コーディング・数学・複雑な推論で強力な性能。Google AI ProプランでAdvanced利用可能。
フルサイズ性能推論強化
2025年3月
Gemini 2.5 Proネイティブ思考
「考える」能力がネイティブに組み込まれた。Chain-of-Thoughtを維持しながらマルチモーダル。コーディング・数学・画像理解で大幅向上。
ネイティブ思考コーディング向上画像理解向上
2025年11月
Gemini 3 Flash次世代の主力
Gemini 3のFlash版。Pro級の推論をFlashの速度で実現。博士レベルの推論能力。Antigravity(エージェント開発プラットフォーム)と同時発表。
Gemini 3世代Antigravity同時発表博士レベル推論
2026年3月
Gemini 3.1 Pro現在の最新フラッグシップ
ARC-AGI-2で77.1%(新しい論理パターンへの対応力)。テキスト・音声・画像・動画・コードリポジトリの理解。Googleマップ連携。Computer Use(自律UI操作)対応。MCP対応。
最新Computer UseMCP対応マップ連携
2026年3月
Gemini 3.1 Flash Lite最安・最速
最もコスト効率の良いGeminiモデル。2.5 Flashの2.5倍高速、出力速度45%向上。大量処理・コスト重視の用途に最適。
2.5倍高速最安大量処理向け
Geminiの歩み:マルチモーダル → 100万トークン → リアルタイム対話 → ネイティブ思考 → Computer Use(自律操作)