昨晚半夜睡不着,翻了一下十年前的老照片。
那时候我刚入行做私募,还在用黑莓手机,全键盘,屏幕小得可怜。
那时候觉得能发邮件能打电话就够了,直到 2007 年乔布斯拿出 iPhone。
大家才恍然大悟,原来手机不只是通讯工具,它是你手指的延伸。
这两天科技圈有个事儿,让我想起了那个瞬间。
OpenAI 和 Anthropic,这两个平时打得不可开交的冤家,突然联手了。
他们推了一个叫MCP Apps的新提案,说要告别纯文本交互。
这意味着什么?意味着以后你跟 AI 聊天,不再是对着一堆文字发呆。
它可以直接给你弹出一个按钮,一个表单,甚至一个完整的操作界面。
这事儿看似技术细节,实则是个大风口的前奏。
今天咱们不聊虚的,就聊聊这背后的逻辑,以及跟你有什么关系。
先说痛点。
你现在用 AI,是不是经常觉得累?
你想让它订张票,它给你一堆文字建议,最后还得你自己去搜链接。
你想让它画个图,它给你一段代码,你还得找个地方运行。
这就像什么呢?就像你去餐厅吃饭,服务员只给你报菜名,不给你菜单。
你得告诉他怎么做菜,甚至还得自己去厨房端盘子。
这就是纯文本交互的局限,它只有嘴,没有手。
当年的 DOS 系统也是这样,你得敲命令,输错了就重来。
后来有了 Windows,有了图形界面,电脑才真正普及到千家万户。
现在 AI 正处在当年的 DOS 时代,而MCP Apps就是那个图形界面。
这个提案的核心,其实是标准化。
以前各家 AI 都有自己的插件体系,互不相通。
开发者做个工具,得适配 OpenAI 一次,再适配 Anthropic 一次。
累不说,还容易出错。
现在他们商量好了,用一套标准来描述界面。
就像 USB 接口一样,不管你是哪家生产的设备,插上去就能用。
这对开发者来说是减负,对用户来说是体验升级。
我看了下提案细节,大概是这样运作的。
AI 模型不再只输出文本,而是输出一段结构化的描述。
这段描述告诉客户端,这里该放个按钮,那里该放个输入框。
客户端根据这个描述,直接渲染出界面。
举个例子,以前你问 AI 怎么转账。
它说:请点击设置,找到支付,输入金额。
现在它直接弹出一个转账窗口,你填完密码就行。
这中间的差距,就是效率,就是体验。
但这里面有个深层次的问题,很多人没注意到。
那就是信任。
当 AI 能直接生成界面让你操作时,你怎么知道这不是个钓鱼网站?
当年互联网初期,弹窗广告满天飞,大家都不敢点。
现在 AI 生成的界面,谁来背书?
提案里提到了资源声明和通信协议,其实就是为了解决这个问题。
服务器要声明这个界面是干嘛的,客户端要验证这个声明。
但这需要时间,需要生态的建立。
我当年做项目踩过一个坑,就是太早相信了标准。
那时候觉得有了标准就能一统江湖,结果发现落地全是坑。
标准是死的,人是活的,利益才是驱动的。
OpenAI 和 Anthropic 之所以能坐下来谈,是因为他们都意识到了瓶颈。
纯文本交互的天花板已经到了,再不升级,用户就要流失了。
这就像当年手机厂商联手推快充标准一样,都是为了把蛋糕做大。
对于普通人来说,机会在哪里?
我觉得有两个方向。
一个是工具开发。
以后不需要你懂复杂的前端代码,只要懂业务逻辑。
你可以用自然语言描述你想要的界面,AI 帮你生成标准协议。
这对中小开发者是大利好,门槛降低了。
另一个是场景应用。
那些需要复杂交互的场景,比如金融交易、医疗咨询、教育辅导。
以前 AI 只能给建议,现在它能直接操作。
这意味着 AI 能从顾问变成执行者。
当然,风险也得提防。
界面标准化后,恶意软件也可能利用这个协议。
比如生成一个看似合法的转账界面,实则窃取信息。
所以安全验证会成为下一个热点。
谁能让用户放心地点击 AI 生成的按钮,谁就能赢。
历史总是惊人的相似。
从命令行到图形界面,用了十几年。
从图形界面到触摸交互,又用了十几年。
现在从文本交互到原生界面,可能只需要几年。
因为基础设施已经准备好了,算力够了,模型也聪明了。
缺的只是一个契机,一个标准。
这次 OpenAI 和 Anthropic 的联手,可能就是那个契机。
咱们作为旁观者,不用急着冲进去。
先看看他们怎么落地,怎么解决安全问题。
但心里要有数,风向变了。
以后评估一个 AI 项目,不光看它聊得怎么样。
要看它能干什么,能直接操作什么。
能动手的 AI,才是好 AI。
就像当年我们选股票,不光看财报,要看现金流。
能落地的技术,才有现金流。
夜深了,不多说了。
这个变革才刚刚开始,后面还有大戏。
咱们走着瞧,保持关注,别掉队。
记住,技术是冷的,但使用技术的人是热的。
无论界面怎么变,解决真实需求才是根本。
愿你在新的浪潮里,都能找到属于自己的那块冲浪板。
晚安。
