
Langchain v1 AI 代理、多模态深度代理、多代理深度高级检索增强生成、Google Gemini 3、Qdrant、Docker 和 Docling。
课程学习内容
- 利用 Google Gemini、LangChain v1、MCP 以及现代智能体设计模式来构建可用于生产的 AI 智能体
- 利用 Docling、Gemini、Qdrant 向量数据库及混合搜索,设计和实现多模态 RAG 流程
- 利用 Docling、Docker 以及结构化数据提取方法,实现 PDF、表格和图像的大规模处理
- 在实际 AI 系统中,实现混合搜索、重排序、记忆功能、MCP 工具以及成本效益高的上下文缓存
- 利用协调者、研究员和编辑代理,为金融场景构建自主多代理研究系统
课程学习要求
具备基本的 Python 知识是必需的。熟悉 API、Docker 或 RAG 概念会更有帮助,但并非强制要求。
课程整体描述
这门课程为您提供了一套完整的、实践性的指导,帮助您利用 Google Gemini、LangChain v1、MCP 以及现代 RAG 技术,构建现实世界中的 AI 代理和深度研究(DeepAgent)系统。
您将从人工智能代理的绝对基础开始,逐步深入学习构建用于深度金融研究的先进自主多代理系统。课程设计循序渐进,既适合初学者跟随学习,也能让经验丰富的开发者掌握高级生产级模式。
本课程不仅关注理论,您将利用 Python 笔记本、真实 API、真实文档和真实数据管道,一步步完成所有内容的构建。
课程核心涵盖内容
你将首先理解 AI 代理的真正含义。你将学习各种代理模式,了解代理的推理方式、行动方法,以及如何为实际项目选择合适的代理设计。
你将随后正确设置 Google Gemini AI Studio 和 LangSmith。这包括创建 API 密钥、了解定价和速率限制,以及跟踪代理执行,以便你可以像专业人士一样进行调试和监控。
从那时起,你将完成一个关于 Gemini 和 LangChain 的完整训练营。你将学习如何在 Python 中使用 Gemini 模型,了解消息的内部处理机制,掌握流式响应的工作原理,学会处理多模态输入,并学会使用工具、函数调用、推理模式、基础和上下文缓存来降低成本和提高性能。
一旦基础打牢,你将深入学习 LangChain 代理。你将学习如何构建具有记忆功能、状态管理、摘要中间件、备用模型、个人身份信息保护、规划器、流式响应以及使用 Pydantic 进行结构化输出的代理。
课程接着通过一个金融案例介绍了 MCP。您将连接 Yahoo Finance 等外部 MCP 服务器,并将它们加载为 LangChain 工具,进而利用结构化提示和规划器构建一个完整的股票研究代理。
深度检索增强生成和多模态金融系统
本课程着重介绍了金融领域的深度 RAG 系统。你将了解多模态 RAG 为何难以实现,PDF、表格、图像及长文档会遇到哪些问题,并学习如何构建一个可靠的深度 RAG 流程。
您将利用 Docling 从财务 PDF 文件中提取数据。这包括将 PDF 文件转换为 Markdown 格式,提取包含上下文的表格,追踪页码,提取图片,并在大规模操作中验证数据的完整性。
你将利用多模态的 Gemini 模型生成精确的图像描述,并将这些描述保在 Markdown 格式中,从而实现所有操作都在一个统一的文本处理流程中完成。
接下来,你将学习如何将大量的多模态数据导入 Qdrant 向量数据库。课程内容包括密集搜索、稀疏搜索、混合搜索、元数据过滤、利用文件哈希进行去重,以及分块和检索模型的最佳实践。
在此基础上,你将运用混合搜索和交叉编码器重排序技术,构建更高级的检索管道,从而提升答案质量。
构建真实的、多人的深度研究系统
在最后部分,你将从头开始构建完整的、基于多代理的深度研究系统。
你将设计协调者、研究员和编辑代理组成的自主代理系统,这些代理能够规划任务、进行深度研究、整合结果,并产出结构化的输出。
你将学习代理状态共享的方式,运行时工具注入的方法,文件由代理管理的过程,以及为协调者、研究员和编辑角色设计不同提示的技巧。
你还将深入探索 LangChain 自带的深度代理架构,并利用子代理和文件后端,构建一个完整的深度金融研究代理。
课程适合人群
这门课程面向希望超越基础聊天机器人,进而开发专业级 AI 系统的开发者。
- 使用 LLMs 工作的 AI 工程师们
- 构建 RAG 系统的后端开发者
- 从事文档和研究工作的数据科学家
- 从事金融和分析工作、对 AI 自动化感兴趣的专业人士
- 希望了解实际生产环境中多智能体系统构建方式的所有人
建议具备基本的 Python 知识,但如果有代理或 RAG 的相关经验则更佳。
完成本课程后,您将能够运用 Gemini 和 LangChain,设计、构建并调试高级 AI 代理、多模态 RAG 流程以及自主多代理研究系统。
你不仅会理解概念,还会构建完整、端到端的系统,这些系统可以在实际项目、初创企业或企业环境中重复使用。
精准适配人群
人工智能工程师、后端开发者和数据科学家,希望借助 LangChain、Docling、Docker 以及 Qdrant,来构建基于 Gemini 的智能代理、多模态 RAG 系统,并开展深度研究工作。
