Next era of AI

💡 洞察: 在大众需要与 LLM-Agent 进行高频交互的时代，谁能做好Info-Share，谁就掌握了先机。

都说 2025年是 Agent 之年，但除了 PPT 上繁花似锦的 demo 之外，Agent 究竟强在何处？这是一个值得思考的问题。

我从 2022年底 chatgpt 出现之后就开始高频使用LLM相关的产品，初次上手确实惊艳，但体验之余总感觉差点意思，直到最近在和 LLM-Agent 高频交互的过程中，我突然意识到，Agent 的本质是信息共享，而信息共享的必要条件是信息获取，也就是说，你在期待它帮你解决问题之前，需要先帮他获取到足够多的信息。

而在实际场景中，我们要完成的任务其实都藏着大量的 grounded knowledge 的，但在与 LLM交互的过程中，我们需要尽可能地将潜意识转化为 text，明确这个这个传递信息的步骤就够头疼的了，更别说在多轮交互中，信息传递的效率和准确性都大大降低。

有没有解决方案呢？

我觉得答案是肯定的，那就是 Info-Share，也就是说，你在期待一个 LLM 或者说 Agent 帮你解决问题之前，仅仅给他很多工具（MCP、function.etc）是不够的，更重要的是先帮他获取到足够多的信息，关于这方面，无论是学术界还是工业界都已经做出了很多尝试，

我个人认为这个过程越无痛越好，目前看到最好的实现方式是：用户一次性写好一个文档（类似于 cursor project mdc 的东西），然后 AI 在交互的时候可以 always read or Agetic read，并且可以根据当前的进度自动 refine or re-generate a new cursor rules。

当然也有一些强交互性质的方式：

比如Agent-Memory layer，它的核心是在你和 llm 对话中自动抽取出关键信息存储；

再比如cursor，它的核心是驱动 llm 去理解你的 repo；

再比如dia（一款 ai 浏览器），它的核心是抓取你当前的网页内容，包括视频字幕，来更好的后续做出交互。

对于企业来说，谁做好了Info-Share，谁就能抢占更大的市场、更多的用户；

而对于个人来说，谁做好了Info-Share，谁就能跟上 AI Agent 发展的潮流，找到自己的定位。

Written on May 10, 2025