Next era of AI

💡 洞察: 在大众需要与 LLM-Agent 进行高频交互的时代,谁能做好Info-Share,谁就掌握了先机。

都说 2025年是 Agent 之年,但除了 PPT 上繁花似锦的 demo 之外,Agent 究竟强在何处?这是一个值得思考的问题。

我从 2022年底 chatgpt 出现之后就开始高频使用LLM相关的产品,初次上手确实惊艳,但体验之余总感觉差点意思,直到最近在和 LLM-Agent 高频交互的过程中,我突然意识到,Agent 的本质是信息共享,而信息共享的必要条件是信息获取,也就是说,你在期待它帮你解决问题之前,需要先帮他获取到足够多的信息。

而在实际场景中,我们要完成的任务其实都藏着大量的 grounded knowledge 的,但 在与 LLM交互的过程中,我们需要尽可能地将潜意识转化为 text,明确这个这个传递信息的步骤就够头疼的了,更别说在多轮交互中,信息传递的效率和准确性都大大降低。

有没有解决方案呢?

我觉得答案是肯定的,那就是 Info-Share,也就是说,你在期待一个 LLM 或者说 Agent 帮你解决问题之前,仅仅给他很多工具(MCP、function.etc)是不够的,更重要的是先帮他获取到足够多的信息,关于这方面,无论是学术界还是工业界都已经做出了很多尝试,

我个人认为这个过程越无痛越好,目前看到最好的实现方式是:用户一次性写好一个文档(类似于 cursor project mdc 的东西),然后 AI 在交互的时候可以 always read or Agetic read,并且可以根据当前的进度自动 refine or re-generate a new cursor rules。

当然也有一些强交互性质的方式:

比如Agent-Memory layer,它的核心是在你和 llm 对话中自动抽取出关键信息存储;

再比如cursor,它的核心是驱动 llm 去理解你的 repo;

再比如dia(一款 ai 浏览器),它的核心是抓取你当前的网页内容,包括视频字幕,来更好的后续做出交互。

对于企业来说,谁做好了Info-Share,谁就能抢占更大的市场、更多的用户;

而对于个人来说,谁做好了Info-Share,谁就能跟上 AI Agent 发展的潮流,找到自己的定位。

Written on May 10, 2025