大模型 · 学习 · 实践 · 分享

探索 AI 的
无限可能

雨昕AI博,记录我在大模型领域的探索与实践。
从 RAG 到 Agent,从理论到落地。

向下滚动
关于我

保持好奇,持续进化

🎓

持续学习者

专注于大模型(LLM)技术栈,深入理解 Transformer 架构、预训练与微调原理,保持对前沿技术的敏锐嗅觉。

⚙️

工程实践者

从 Prompt 工程到 Agent 编排,从 RAG 检索增强到 MCP 协议接入,动手搭建可落地的 AI 应用方案。

📝

知识分享者

将学习过程系统化沉淀,通过文档、案例与项目,与社区共同成长,让 AI 技术更易理解与应用。

技术模块

四大核心方向

围绕大模型应用开发的完整技术栈,深入每一个关键环节

01 — RAG

检索增强生成
让模型拥有专属记忆

RAG(Retrieval-Augmented Generation)通过将外部知识库与大模型结合, 解决模型知识滞后、幻觉严重、无法访问私有数据等核心痛点。 它是当前企业落地大模型最成熟的方案。

  • 文档处理

    PDF、Word、Markdown 等多格式解析,智能分块与向量化

  • 语义检索

    基于 Embedding 向量的高精度语义匹配,支持混合检索

  • 上下文增强

    将检索结果注入 Prompt,显著提升回答准确性与可信度

  • 引用溯源

    每个回答附带来源引用,支持知识溯源与可信验证

1 知识入库
2 向量检索
3 上下文组装
4 精准生成
Prompt 模板
工具调用
输出解析
质量校验
可复用能力
02 — SKILL

技能搭建
构建可组合的 AI 能力

Skill 是封装好的大模型能力单元,将 Prompt 设计、工具调用、输出处理 打包为标准化、可复用的组件。好的 Skill 设计,是构建复杂 AI 应用的基石。

  • Prompt 工程

    结构化提示词设计,涵盖 Few-shot、CoT、ReAct 等高级技巧

  • 能力封装

    将复杂任务拆解为原子能力,标准化输入输出与异常处理

  • 组合编排

    多个 Skill 灵活组合,构建端到端的业务工作流

  • 效果评测

    建立量化评估体系,持续优化 Skill 的稳定性与准确性

03 — MCP

模型上下文协议
连接 AI 与万物

MCP(Model Context Protocol)是大模型连接外部世界的标准化协议。 它定义了模型如何安全、高效地访问数据库、调用 API、操作文件系统, 是构建工具增强型 AI 应用的关键基础设施。

  • 标准协议

    统一的接口规范,一次开发,多模型多客户端通用

  • 资源接入

    数据库、文件系统、第三方 API,一键接入模型上下文

  • 工具调用

    模型自主决策何时调用何工具,实现真正的 Function Calling

  • 安全隔离

    权限控制与沙箱机制,保障外部资源调用的安全性

大模型
📁 文件系统
🗄️ 数据库
🌐 Web API
⚙️ 开发工具
🧠 感知思考
📋 任务规划
执行行动
👁️ 观察反馈
04 — AGENT

智能体
会思考的 AI 行动派

Agent 是大模型应用的高级形态,具备自主感知、规划、决策与执行能力。 它不再只是回答问题,而是能够拆解复杂目标,调用工具完成任务, 在行动中观察反馈并持续优化策略。

  • 自主规划

    将复杂目标拆解为可执行步骤,动态调整执行路径

  • 工具使用

    自主选择并调用合适的工具,完成搜索、计算、代码执行等任务

  • 记忆系统

    短期记忆与长期记忆结合,保持上下文连贯与经验积累

  • 反思进化

    基于执行结果进行自我反思,持续优化决策与行动策略

学习路线

从入门到精通的成长路径

系统化的学习阶梯,每一步都扎实前行

Phase 1

基础认知

理解大模型基本原理,掌握 Prompt 工程核心技巧,建立对 LLM 能力边界的清晰认知。

Transformer Prompt Token
Phase 2

知识增强

深入学习 RAG 架构,实践文档处理、向量检索与上下文工程,构建私有知识问答系统。

Embedding Vector DB RAG
Phase 3

工具连接

掌握 MCP 协议与 Function Calling,让大模型连接外部工具与数据源,突破能力边界。

MCP Function Call API
Phase 4

智能体构建

综合运用 Skill、RAG、MCP,构建具备自主规划与执行能力的 Agent 系统,解决真实业务问题。

Agent Planning Multi-Agent
Phase 5

工程落地

关注性能优化、成本控制、安全治理与效果评测,将 AI 能力稳定地交付到生产环境。

Eval Deploy Scale
0 核心技术模块
0 实践项目
0 技术文档
0 学习阶段

一起探索大模型的
无限可能

技术的价值在于分享与共创,期待与你一同前行