第43回ブログ:LLMs + GenAI + Agents AI Stack — 2025年最新AIスタック徹底解説
■ はじめに ― AI開発の“全体設計図”が必要な時代
2024〜2025年、AI開発の主役は「LLM」単体活用から、生成AI(GenAI)・AIエージェント・マルチモーダル生成・業務連携自動化の“統合運用”へと大きく進化しています。
もはや1つのAIやAPIだけでDXは語れません。
各レイヤーの役割と、現場での組み合わせ・最適化こそが「競争力」となります。
本記事では、エンジニア視点で「LLMs + GenAI + Agents AI Stack」の
全体像/各レイヤーの具体的な中身/実際の連携イメージ/現場での設計指針まで、図解とともに徹底解説します。
■ まずは全体像を直感的に掴む(最新フローチャート図)
最新AI活用の全体像を5レイヤーで整理した図が下記です。
下層から上層へデータ・知識→AIエンジン→生成AI→エージェント→業務アプリ層へと情報が流れ、
各層ごとにOSS・API・サービスを最適に組み合わせる設計が基本です。
■ 5層構造の詳細解説 ― それぞれの役割と代表例
-
1. データ・ナレッジ層 / Data & Knowledge
自社内のドキュメント・DB・ファイル・メール等、業務資産や外部Web/API・OSS辞書も含む「情報源」の全て。
全てのAI活用は、この層の構造化・蓄積・アクセス設計から始まります。
-
2. AIエンジン層 / LLMs & Specialized Models
・大規模言語モデル(LLM / Foundation Models)…GPT-4, Llama 3, Claude 3, Gemini 1.5など、膨大な知識と推論能力。
・軽量・特化LLM(Specialized/Lightweight LLM)…Phi-3, TinyLlama, OpenChat, Hermes 2 Proなど、コスト効率や用途特化型。
複数モデル組み合わせによるプリフィルタや専門業務分離も有効。
-
3. 生成AIツール層 / Generative AI Tools
・テキスト生成…ChatGPT, Claude, Geminiなど。
・画像生成…Stable Diffusion, DALL·E 3, Midjourney, Leonardo.AIなど。
・動画・音声生成…RunwayML, Suno, ElevenLabsなど。
プロンプトによるマルチモーダル生成や、API連携での自動アウトプット化が可能。
-
4. エージェント層 / AI Agents
・エージェントフレームワーク…LangGraph, CrewAI, AutoGen, AgentVerseなど、複数AIの連携や自動タスク分担に。
・DIY/OSSエージェント…BabyAGI, Camel-AI, MetaGPT, ChatDev, Superagentなど、自社フローに合わせてカスタム自動化。
RAG(Retrieval-Augmented Generation)や業務ワークフロー自動化はこの層で実装。
-
5. サービス・アプリケーション層 / Application Layer
・RAG(検索AI)…社内文書やFAQ自動検索AI、カスタム業務アシスタントなど。
・自動応答/業務フロー…チャットボット、ワークフロー連携、DX基盤。
・ユーザーインターフェース…Webアプリ/チャットUI、BIダッシュボード等。
最終的な価値提供。ユーザーが直接恩恵を受ける部分。
各層の代表OSSやSaaSを選ぶ基準は「用途」「コスト」「運用性」「セキュリティ」「社内ノウハウ」と現場要件次第です。
どの層をセルフホスト/クラウド/外部APIにするかも全体設計次第で柔軟に設計できます。
■ エンジニアのための「AIスタック」実践設計ポイント
- APIで“層”を分離・統合: 各レイヤーをREST/GraphQL/SDKで疎結合し、バージョン管理やカナリア運用も容易に。
- OSS × クラウドのハイブリッド: 軽量モデルや生成AIをオンプレ/エッジで、LLMやエージェントをクラウドAPIで、など構成最適化。
- エージェント自動化設計: LangChainやAutoGen等でプロンプト分割・ツール連携・外部API実行・マネージャーAI導入。
- セキュリティ・認証: Keycloak, LDAP, SSO連携やVPC構築で情報統制。監査ログや社内ルール適用も意識。
- RAG・ワークフロー自動化: 社内DB・ファイル×生成AI×AIエージェントを“自社専用の知識基盤”として統合。
「どのAIを使うか」ではなく、「どう組み合わせて結果を出すか」の時代へ。
各層を意識して現場要件に合わせて最適化するのが、これからのエンジニアの本質的価値です。
■ ケーススタディ&導入イメージ
-
導入事例A(製造業):
社内技術文書をRAG×エージェントで検索自動化し、技術者の問い合わせ工数を半減。
-
導入事例B(コールセンター):
FAQと社内マニュアルをLangChain+Keycloakで統合し、応答品質向上+OJT短縮。
-
導入事例C(自社サービス開発):
アプリ層で顧客対応チャットAIを、エージェント層でワークフロー自動化、LLM層で生成API最適化。
■ FAQ:よくある質問
Q. 小規模でもAIスタック導入は現実的?
はい。LLM/エージェント/生成AI層はAPIやOSSでも導入でき、小規模・段階的スタートが可能。
業務特化RAGやワークフロー自動化から始める事例も多いです。
Q. オンプレ・セルフホストで運用できますか?
可能です。特にデータ・AIエンジン層はプライベートVPCやローカルLLM、Keycloak認証連携等で高セキュア運用も構築可能です。
Q. 自社データをAIに安全に活用できますか?
RAGや社内LLM構成で、外部クラウドにデータを出さずにAI活用が可能。アクセス制御や認証統合も標準化できます。
Q. 継続運用・拡張性のポイントは?
API分離・OSS活用で将来モデル差し替え・追加も容易。DevOps/CI/CD・監査ログ連携も実装推奨です。
まずは「AIスタック全体設計」のイメージを掴み、小さく導入→徐々に業務横断へ拡張していくのが成功の近道です!
■ まとめ:AI時代の“設計力”がエンジニアの最大武器
LLM・GenAI・エージェント・RAG・UI層まで俯瞰し、「現場の情報・業務フロー・AI資産」をいかに組み合わせ最適化するか――。
これがこれからのAI開発・DX推進の本質です。
全体を見据えた設計力と、OSS/APIを柔軟に活用する現場感覚を持つエンジニアこそが最強です。
本記事と図を、みなさまの現場・提案・学習にぜひご活用ください。