2025-05-30 18:59:55 +08:00

6.3 KiB
Raw Permalink Blame History

什么是 MCP

MCP (Model Context Protocol)是一种开放协议用于标准化应用程序如何向大型语言模型LLMs提供上下文。可以将 MCP 想象为 AI 应用的 typec 接口。正如 typec 提供了一种标准化的方式将您的设备连接到各种外设和配件MCP 也提供了一种标准化的方式,将 AI 模型连接到不同的数据源和工具。

MCP 协议由 Anthropic 在 2024 年 11 月底推出:

为什么需要 MCP

我们都知道,从最初的 chatgpt到后来的 cursorcopilot chatroom再到现在耳熟能详的 agent实际上从用户交互的角度去观察你会发现目前的大模型产品经历了如下的变化

graph LR

a(chatbot > deepseek, chatgpt) --> b(composer > cursor, copilot) --> c(agent > AutoGPT, Manus, Open Manus) 
  • chatbot
    • 只会聊天的程序。
    • 工作流程:你输入问题,它给你这个问题的解决方案,但是具体执行还需要你自己去。
    • 代表工作deepseekchatgpt
  • composer
    • 稍微会帮你干活的实习生,仅限于写代码。
    • 工作流程:你输入问题,它会给你帮你生成解决问题的代码,并且自动填入代码编辑器的编译区,你只需要审核确认即可。
    • 代表工作cursorcopilot
  • agent
    • 私人秘书。
    • 工作流程:你输入问题,它生成这个问题的解决方案,并在征询了你的同意后全自动执行。
    • 代表工作AutoGPTManusOpen Manus

为了实现 agent也就需要让 LLM 可以自如灵活地操作所有软件甚至物理世界的机器人于是需要定义统一的上下文协议与之上统一工作流。MCP(model context protocol) 就是解决这套方案的应运而生的基础协议。一个感性认识如下:

graph TB

user(用户)
ai(AI软件)
llm(大模型)
computer(本地环境)

user --帮我整理两会报告中有\n关AI的咨询到word文件--> agent

subgraph agent

ai <--MCP--> llm
computer <--MCP--> ai

end

agent --> word(D:/会议总结/两会报告AI专题.docx)

:::info

Anthropic 对于 MCP 的必要性给出的解释MCP 帮助您在 LLMs 之上构建 agent 和复杂的工作流程。LLMs 经常需要与数据和工具集成,而 MCP 提供了以下支持:

  • 一系列不断增长的预构建集成,您的 LLM 可以直接接入这些集成。
  • 在 LLM 提供商和供应商之间灵活切换。
  • 在基础设施内保护数据的最佳实践。

:::

总体架构

MCP 的核心采用客户端-服务器架构,其中 host 可以连接到多个服务器:

graph LR

host[Host MCP 客户端\n 浏览器, 代码编辑器, 其他工具]

server_a[MCP 服务器 A]
server_b[MCP 服务器 B]
server_c[MCP 服务器 C]

db_a[(本地\n数据源 A)]
db_b[(本地\n数据源 B)]

remote[(远程服务 C)]

subgraph 你的电脑
direction LR
host <--MCP 协议--> server_a
host <--MCP 协议--> server_b
host <--MCP 协议--> server_c
server_a <--> db_a
server_b <--> db_b
end


subgraph 互联网
server_c <--Web APIs--> remote
end
  • MCP 主机MCP Hosts MCP 主机是指希望通过 MCP 访问数据的程序,例如 Claude Desktop、集成开发环境IDEs或其他 AI 工具。
  • MCP 客户端MCP ClientsMCP 客户端是与服务器保持 1:1 连接的协议客户端,负责与 MCP 服务器通信。
  • MCP 服务器MCP ServersMCP 服务器是轻量级程序,每个服务器通过标准化的 Model Context Protocol 暴露特定的功能。
  • 本地数据源Local Data Sources本地数据源是指 MCP 服务器可以安全访问的计算机文件、数据库和服务。
  • 远程服务Remote Services远程服务是指 MCP 服务器可以通过互联网连接的外部系统(例如通过 API 访问的服务)。

MCP 的工作流程

从工作流程上MCP 和 LSP 非常非常像,事实上,目前的 MCP 和 LSP 一样,也是基于 JSON-RPC 2.0 进行数据传输的基于Stdio 或者 基于SSE。如果开发过 LSP 的朋友对于 MCP 应该会感到非常的理所当然。我将用若干个简单明了的泳道图尽可能让大家看懂这玩意儿是如何执行的。

初始化

假设我们的软件已经支持了 MCP 客户端,那么当我们的软件启动时,它会经历如下的步骤:

graph TB
    subgraph MCP 客户端
        A1[初始化]
        A2[获取 MCP 服务端提供的工具集合 \n1. 创建文件 -> createFile\n2. 删除文件 -> deleteFile\n3. 使用搜索引擎 -> useBrowser\n 4. ...]
    end

    subgraph MCP 服务端
        B1[初始化]
    end
    
A1 --startMCPServer--> B1
B1 --ListToolsRequestSchema--> A2

工作流程

假设,你是一位 C语言工程师你现在想要让 agent 自动完成一个项目的编译,那么执行流程如下:

graph TB
    subgraph MCP 客户端
        A1[用户询问 请帮我删除 build\n下的所有编译的中间结果] --> A2[将用户询问, 资源, MCP服务端的工具集合发送给大模型]

        A3[大模型返回操作流\n1. deleteFile build/a.o\n2. deleteFile build/b.o]
        A4[整理操作结果给大模型]
        A5[最终响应展示给用户]
    end

    subgraph MCP 服务端
        B1[解析大模型操作流] --征询用户同意--> B2[执行操作流]
    end
    
    subgraph 大模型
    	C1[大模型基于上下文生成操作方案]
    	
    	C2[大模型基于所有信息生\n成自然语言响应]
    end
   
A3 --> B1
B2 --> A4
A2 --> C1
C1 --> A3
A4 --> C2
C2 --> A5

开源生态

和 LSP 一样LSP 在开源社区有非常多的客户端和服务端框架MCP 也是一样的,目前 Anthropic 开源了一套 MCP 的服务端框架:https://github.com/modelcontextprotocol/servers ,想要探索大模型效用的朋友可以尽情去使用这个框架。这个仓库还收录了很多的官方认可的 MCP 服务器,可以作为学习的参考。

除此之外pulsemcp 上也有很多开源社区开发的 MCP 客户端和服务端:https://www.pulsemcp.com/clients