反对MCP的理由:大型语言模型应适应世界,而非反之
模型控制协议(MCP)由Anthropic提出,被描述为大型语言模型(LLM)与外部世界交互的通用接口,类似于计算机上的USB-C端口,通过它可以连接各种工具、API和系统。乍看之下,这种标准化似乎很实用,承诺为AI在多样化应用中提供无缝集成。然而,仔细审视后,MCP暴露为一个有缺陷且可能不必要的解决方案。它并未赋予LLM以人类方式导航复杂数字生态的能力,而是强加了一个简化的中间层,反映了当前AI的局限性,并有迅速过时的风险。本文认为,LLM应利用其固有的适应性,直接与现有工具和API交互,并通过自动驾驶汽车的类比以及对AI发展的洞察来阐述这一观点。
MCP的承诺与缺陷
Anthropic将MCP描述为一个标准化协议,使LLM能够安全、高效地与外部系统交互。如同USB-C端口允许计算机连接各种外设,MCP旨在简化LLM访问数据库、API或软件工具的方式。对于开发者而言,这种抽象化可以简化集成,确保LLM在可控、可预测的框架内运行。在企业工作流或基于聊天的休闲界面等场景中,MCP的统一性可能降低复杂性,为非技术用户或注重安全性的组织提供即插即用的体验。
然而,为何需要为LLM设计专用协议?这引发了一个根本问题:LLM既然被设计为模仿人类推理,为何不能直接使用现有接口?LLM具备生成代码、解析文档和适应多样化环境的能力,理应能直接与现有数字世界交互。创建像MCP这样的新协议,类似于为每个工具和API搭建桥梁——这是一种低效且不可持续的努力。数字生态系统庞大且碎片化,包含无数API、格式和标准。为LLM标准化这一混乱局面,就像为了AI重写互联网一样不切实际。
更重要的是,MCP凸显了一个更深层次的问题:当前LLM的局限性。这些模型在很大程度上依赖上下文窗口,提供的是浅显、临时的知识,而非深入的领域专长。MCP通过以简化的标准化格式呈现工具来弥补这一缺陷,但这种方式本质上具有局限性。它假设LLM无法应对现实世界接口的复杂性,需要人类为AI预先包装世界。这颇具讽刺——LLM被誉为问题解决者,但MCP却暗示它们需要被简化世界才能有效运作。
类比:自动驾驶汽车与基础设施
为了说明MCP的缺陷,我们可以参考自动驾驶汽车的发展,这提供了一个鲜明的类比。实现自动驾驶的一种方法是创建车辆与道路之间的标准化通信系统——智能基础设施,包括传感器、信号和车路协同网络。这需要对全球交通系统进行彻底改造,成本高昂、复杂无比,被广泛认为不可行。相反,主流方法是将智能嵌入车辆本身。通过摄像头、雷达和AI,汽车像人类一样解读现有道路、标志和交通模式,适应世界而无需重新设计。
MCP类似于不太实际的自动驾驶方法。通过创建标准化协议,它试图为LLM改造数字世界,类似于为汽车建造智能道路。这给开发者带来了沉重的负担,需要将工具适配到MCP的框架中,可能会形成一个封闭的生态,只有兼容MCP的系统才能被访问。相比之下,LLM可以效仿车辆端的智能模式,依靠其代码生成和推理能力,直接导航API、解析文档并执行任务。正如基于视觉的自动驾驶汽车已被证明更具可扩展性,适应现有数字生态的LLM也可能超越MCP的受限方法。
LLM自主性的理由
MCP的替代方案显而易见:赋予LLM在当前数字环境中作为自主代理运作的能力。想象一个LLM在具有互联网访问权限的虚拟机中运行,能够浏览文档、下载工具、生成代码、编译并执行它。这样的代理无需简化的协议——它将学会调用API、处理错误并适应新系统,就像人类程序员一样。这一愿景与AI的最新趋势相符。截至2025年,代理型AI系统(例如AutoGPT的继任者)已展现出执行复杂工作流的能力,从查询REST API到调试脚本,无需依赖标准化的中间层。
这种方法充分利用了LLM的优势:多功能性和适应性。与人类不同,LLM可以即时处理大量文档,按需生成定制代码,并快速迭代。要求像MCP这样的协议来调解它们的交互,削弱了这些能力,迫使LLM进入一个限制其潜力的僵化框架。例如,在“氛围编码”(即休闲的探索性编程)中,MCP可能通过聊天界面实现快速原型。但对于严肃的应用,如构建生产级软件,生成直接调用API的本机代码远更有效。本机代码避免了MCP的开销,提供了标准化协议无法匹敌的精度和灵活性。
反对意见与局限性
MCP的支持者可能认为,标准化能增强安全性和可靠性。如果没有可控的接口,LLM自由与API交互可能带来风险,例如执行恶意代码或误解复杂系统。在企业环境中,MCP的统一性可以简化审计和合规性,确保AI行为可追踪。此外,当前LLM并非完全自主——它们在长期规划和边缘情况(如模糊的API文档或速率限制)上仍有困难。MCP可能是一个实用的过渡方案,使LLM在推理能力提升之前能够发挥作用。
这些观点有一定道理,但无法掩盖MCP的缺陷。安全问题可以通过沙盒环境或强大的错误处理来解决,而无需为LLM简化世界。过渡方案的论点在AI快速发展面前也显得脆弱。随着LLM向更深层次的推理演进——可能通过强化学习或持久记忆的整合——MCP的作用将逐渐减弱。为今日局限设计的协议,明天可能成为过时之物,就像早期依赖车道标记的自动驾驶系统被基于视觉的AI取代一样。
前进之路
MCP是一种过渡技术,反映了LLM当前的未成熟状态。它在特定场景中表现出色,如为休闲用户提供对话工具,但在实现通用AI的宏伟目标上显得不足。数字世界过于复杂,无法抽象为单一协议,而LLM过于强大,无法被单一协议束缚。相反,我们应投资于模仿人类程序员的LLM:浏览网络、学习文档、为现实世界系统量身定制解决方案。这种方法不仅最大化了LLM的潜力,也与AI的初衷相符——增强而非限制人类的创造力。
自动驾驶汽车的类比提醒我们,边缘智能——无论是车辆还是LLM——比改造世界更具扩展性。正如道路保持不变而汽车变得更智能,数字生态也应维持现状,由LLM适应其多样性。MCP可能提供短期便利,但未来属于自主AI代理,它们能以人类般的灵敏度导航世界。通过押注于LLM的适应性,我们可以释放它们的真正潜力,使MCP成为一个不那么雄心勃勃的时代的遗物。