AI 产品分析框架
创建日期: 2026-03-12 最后更新: 2026-04-27 用途: 评估 AI 产品的定位、叙事、价值和可行性
框架概述
这个框架是一个活文档,随着我们收集更多行业洞察和案例而不断演进。
每当我们发现有价值的分析维度,就会将其纳入这个框架,形成越来越完整的评估体系。
⚠️ 适用范围说明(2026-04-21 新增)
本框架最初针对 B2B / Agent 工具产品设计。分析消费级内容平台时,部分维度需转换视角:
| 维度 | B2B Agent 产品 | 消费级内容平台 |
|---|---|---|
| 时代定位 | GUI税、Agent-facing、协议优先 | 内容飞轮、创作者生态、文化匹配 |
| 商业模式 | TPD / 按算力收费 | 内容平台分成、创作者经济 |
| Agent-native壁垒(维度9) | 核心维度 | 基本不适用,改用”内容网络效应”评估 |
| 竞争定位 | 平台吃功能、垂类不做 Agent OS | 平台内化威胁(巨头原生化)、内容差异化 |
消费级平台的附加核心问题:
- 内容飞轮是否已经转起来?(创作者数量 × 内容质量 × 玩家留存)
- 巨头是否有动机和能力把这个功能原生化?(占优策略分析)
- 创作者生态的锁定逻辑是什么?(迁移成本来源)
案例:Case - LinearGame Yoroll - AI原生互动影游平台 — 消费级内容平台的首个完整分析样本
互补评估工具
Data Agent 产品分析框架
文档: Data Agent产品分析框架
从 a16z + OpenAI 两篇文章提炼的垂直化分析框架,专用于评估数据驱动的 Agent 产品。
核心论断: Data Agent 的护城河不在模型能力,而在上下文深度。
五维评估:
- 上下文深度(六层标尺:Schema → Usage → Annotation → Code → Institutional → Memory)
- 推理闭环(自我修正能力)
- 信任基础设施(透明性 + 可验证性 + 权限 + 评估)
- 集成深度(独立工具 → 多入口 → 工作流引擎)
- 上下文维护成本(静态语义层 vs 动态自更新)
何时使用:评估任何以”数据分析”、“BI 智能化”、“Text-to-SQL”为卖点的 AI 产品。
AI 协同产品四轴设计框架
文档: 2026-04-02 - AI协同产品四轴设计框架 - Wayne Zhang
技术趋同后,AI 协同产品的实质差异来自四个设计维度上的立场选择。核心张力围绕 个人 × 组织 × AI 的三角关系。
四轴:
- 人机关系(人在场/协同 ↔ 人离场/自主)
- 记忆范围(用户级记忆 ↔ 组织级知识)
- 约束方式(Prompt 软约束 ↔ 编码硬约束)
- 运行位置(用户端本地 ↔ 公司端云端)
使用方式:对任何 AI 协同类产品,在四根轴上各标一个位置。点位重合 = 直接竞品;差异最大的轴 = 真正的差异化来源;位置模糊 = 产品定义不清的信号。
何时使用:评估任何涉及”人 + Agent 协作”的产品(项目管理、编程助手、企业协作、自动化工作流)。
VC 投资评估框架
可用 Skill: vc-investment-evaluator
从风险投资视角评估 AI 产品/开源项目的投资价值。基于 Zoo Capital(管理 20 亿+ 美元)的专业投资框架,专为 AI 周期校准。
何时使用:
- 客户咨询:“VC 为什么拒绝/接受我?”
- 评估竞品的融资潜力
- 创业准备:理解 VC 的决策逻辑
- 判断一个项目是否值得融资
与产品分析框架的区别:
| 产品分析框架 | VC 投资评估框架 |
|---|---|
| 关注产品层面 | 关注投资回报 |
| 帮助理解”是不是好产品” | 帮助理解”是不是好投资” |
| 适合产品研究者、咨询顾问 | 适合创业者、VC |
使用方式:
从 VC 视角看 InsForge
给 Hermes Agent 打分
评估这个项目的投资价值
分析维度
维度 1: 时代定位 ⭐
核心问题: 这个产品是否站在正确的时代浪潮上?
判断标准:
| 检验项 | 是/否 |
|---|---|
| 产品是否为 AI/Agent 时代原生设计? | |
| 是否采用 API-first 架构? | |
| 是否考虑了 Agent 作为主要用户的场景? | |
| 是否符合”Make something agents want”的方向? |
深层洞察:
-
SaaS 的本质解构(@pontusab):
- 传统 SaaS = 数据库 + 流程推理模板
- 数据库需要托管(商品化趋势)
- 流程推理是战场:模板化 → AI 自定义
- “这完全是撞在 AI 的枪口上”
-
Agent 协作的基础设施需求:
- Agent 需要 Public IP + Domain(可被发现)
- P2P 技术将被 AI 激活(隐私协作)
- 最佳实践交流在 Agent 之间展开
-
AI 进化的三阶段(陈天桥三阶段):
- Enable(加法逻辑):旧流程 + AI 插件,人是 CPU
- Native(乘法逻辑):从第一性原理为 AI 设计,AI 是 CPU
- Awaken(觉醒):AI 开始定义工作
GUI = 界面税(2026-03-18 新增):
GUI 的存在是一个补偿系统,通过视觉引导、空间布局、即时反馈,帮助一个带宽极度有限的执行者勉强完成任务。Figma 的精美、Notion 的简洁、Linear 的流畅……这些设计溢价的本质是让人类更愿意盯着屏幕。——真格基金钟天杰
核心推论:
- 以用户体验为护城河的软件公司,都是注意力公司的变体
- 一旦用户不是人类,这种竞争优势就会归零
- GUI 在 Agent 时代降级为”控制面板”(情绪价值),不再是护城河
Software as Protocols(协议即软件):
- 协议不在乎界面好不好看;协议需要稳定、可靠、无处不在
- 新时代产品评价体系:接口稳定 = 信用;文档清晰 = 美;响应可预测 = 靠谱;数据独家 = 地位
- 一旦成为某个 Agent 工作流里的默认调用,后来者便很难替代你
Agent 交互协议化(2026-04-01 新增):
Linear 发布 AIG(Agent Interaction Guidelines),将 Agent 交互从”功能”升级为”协议”:
- 6 条交互原则 + 完整的 Session/Activity/Signal API
- delegate ≠ assignee(责任归属的协议级保证)
- Agent 零成本安装(不计费 = 零采用摩擦)
- 任何 SaaS 都可以 follow 这套设计让自己 Agent-friendly
核心推论:
- “Agent 友好”将成为 SaaS 的 table stakes(如 2015 年的移动端适配)
- 独立的 Agent 协作平台(如 Multica)被挤压——各平台会原生实现 Agent 交互
- Agent 基础设施层(身份、支付、通信)反而受益——更多平台接入 Agent = 更多底层需求
参考依据:
Agent 交互范式:触发式与拦截式(2026-04-06 新增):
Agent 协作产品存在两种交互范式,对应陈天桥三阶段的不同天花板:
| 触发式(对话) | 拦截式(委派) | |
|---|---|---|
| 交互 | @agent → 自然回复 | 创建 task → 分配 agent |
| 类比 | 在 Slack 里 @ 同事 | 在 Linear 里创建 ticket |
| 思维模型 | 协作论(平等参与者) | 控制论(管理者→执行者) |
| 代表产品 | Slock | Multica |
| 天花板 | Agent 越强 → 对话越少 → 自然走向人离场(Awaken) | Agent 越强 → 审批成瓶颈 → 需要重构(卡在 Native) |
核心推论:把 Agent 当人(@agent),而不是当任务执行器(assign to agent)。技术细节(worktree/clone)应该消失在交互之下。
理想形态:在四轴框架轴1(人机关系)上可滑动——日常用 @agent 对话,复杂项目切换看板视图。
参考依据:
- Case - Slock - AI-native协作聊天室 — 触发式/对话式代表
- Case - Multica - Agent协作项目管理 — 拦截式/委派式代表
“Enable 伪装成 Native”反面模式(2026-04-04 新增):
一些产品声称 AI Native,实际是在旧产品上贴 AI 标签。识别方法:
| 检验项 | Enable 伪装 | 真 Native |
|---|---|---|
| 拿掉 AI 后? | 产品”变慢了”(仍可运行) | 产品”不存在了” |
| GUI 投入 | 重度多端 GUI | API/CLI/协议优先 |
| Agent 角色 | 在平台内执行人类指令 | Agent 是一等用户 |
反面案例:Case - MagiCrew - 伪开源企业AI全家桶 — 去掉 AI 仍是协作办公平台,重度交界面税,垂类在做 Agent OS。
AI Native(AI 原生)定义:
从一开始就把 AI 当成核心能力来设计的产品、团队或公司,而不是在传统系统上”后加一个 AI 功能”。
核心特征:
- 产品或公司逻辑本身由 AI 驱动
- 自动理解需求、生成内容、执行任务、持续优化
- AI 是 CPU,人类做策略和例外管理
三个判断标准(区分 Enable vs Native):
| 问题 | Enable | Native |
|---|---|---|
| 存亡:把 AI 拿掉,业务是”变慢了”还是”不存在了”? | 变慢了 | 不存在了 |
| 流转:谁是”传球”的人? | 人类 | AI 之间直接”握手” |
| 记忆:系统是在”消耗”数据还是”吞噬”经验? | 消耗数据 | 吞噬经验 |
“吞噬经验”的三种范式(2026-04-30 新增):
| 范式 | 数据形态 | 学习机制 | 优劣 |
|---|---|---|---|
| RAG | 静态文档 + 向量检索 | 用前嵌入,用时检索 | 工程成熟;但知识库需先整理 |
| Fine-tune | 标注训练集 | 梯度更新参数 | 行为深度内化;但成本高、迭代慢 |
| ORR(Observe-Record-Replay) | 生产对话本身 | 观察队友给真实用户的回答 → 绑定到原始问题 → 形成 case base | 冷启动低、grounding 强、持续累积;但依赖团队回答 Day1 问题 |
ORR 的代表:Case - Lucius - 组织context层 — Day1→Day4 学习循环(用户问 → 不会 → 转人工 → 队友答 → 第二个用户同问题直接答)
ORR 的本质:不是新技术,是新的数据来源选择——把”队友给真实用户的真实回答”作为训练数据,天然带 grounding 与情境。这种学习模式适合对外触点 / 客服 / 社区运营等本就有”团队答用户”工作流的场景。
- ❌ 更快的马车:旧流程 + AI 包装
- ✅ 真正的内燃机:AI Native 设计
参考依据:
- 2026-03-12 - Building for Trillions of Agents - Aaron Levie - Agent 将成为软件的主要用户
- 2026-03-12 - SaaS的本质与AI机会 - pontusab - SaaS 解构与 Agent 协作需求
- 2026-03-12 - AI进化的三阶段与拟物化陷阱 - 陈天桥 - AI Enable/Native/Awaken 框架
- 企业中 agent 数量可能是人类的 100-1000 倍
- API-first 不是可选项,是生存必需
产品案例:
- ✅ Case - Composio - AI Agent工具集成平台 - API 为核心,兼容主流框架
- ✅ Case - InsForge - Agent原生数据库 - Agent-native 数据库(数据库托管 + 自定义业务逻辑分离)
- ✅ Case - Qveris - Agent时代的基础设施 - 统一工具调用接口(Agent 之间的”语言”)
- ✅ Case - db9.ai - Postgres for Agents - SQL + 文件系统统一接口,Agent 一等用户
- ✅ Case - agentcard.sh - Agent支付基础设施 - 补齐 Agent 自主执行的最后一环
- ✅ Case - evlog.dev - Wide Event日志库 - Built for AI-Assisted Development
- ✅ Case - AgentMail - Agent邮件基础设施 - Agent-Native 邮件基础设施(inbox API + 身份层)
- ✅ Case - Tessl - Agent技能的npm - Agent 知识供应链,做 Agent 的”燃料”而非 Agent 本身
- ✅ Case - 毕昇与Clawith - 数据元素的两代产品 - Enable→Native 跃迁的完整样本(毕昇=Enable,Clawith=Native)
- ✅ Case - HMA - 医疗健康Agent评测基准 - Agent 生态的”质检站”,评测基准即基础设施(盛大集团)
- ✅ Case - Lucius - 组织context层 - ORR 学习范式 + Native + Act 单点 Awaken(Multica 同团队跃迁后产品)
- ❌ Case - MagiCrew - 伪开源企业AI全家桶 - Enable 伪装成 Native 的典型反面教材
维度 2: 场景边界 ⭐
核心问题: 这个产品是否做对了该做的事?
判断标准:
效率型场景 ✅ 适合
- 人类不享受的过程
- 属于摩擦成本
- 目的就是目的(结果是唯一价值)
检验问题:
如果这件事不存在,人类会高兴吗?
- 会 → 适合 AI 介入
- 不会 → 不适合替代
连接型场景 ❌ 不适合
- 价值在于过程本身
- 需要情感投入和共同经历
- 过程本身就是目的
能力解锁型场景 ✅ 适合(2026-04-21 新增)
- 用户之前根本没有入口,而非”有但很慢”
- AI 打开了一扇之前不存在的门,而不是让已有的门更顺畅
- 没有”更慢的版本”可供对比
与效率型的区别:
- 效率型:人以前能做,AI 让它更快(代价是过程体验降级)
- 能力解锁型:人以前做不到,AI 让它变得可能(没有降级问题)
检验问题:
没有这个产品,用户做不到这件事,还是做得很慢?
- 做不到 → 能力解锁型(高价值,难替代)
- 做得很慢 → 效率型(有价值,但替代成本较低)
案例:Case - LinearGame Yoroll - AI原生互动影游平台 — 短视频创作者以前根本没有游戏创作的技能入口,Yoroll 不是”让游戏创作更快”,而是”打开了这扇门”
可应用范围:
- A2A 产品评估
- 自动化边界判断
- 人机协作模式设计
- 消费级平台的场景定性
参考依据:
- 2026-03-12 - A2A Agent的边界 - 效率vs连接 - A2A 应该碰”目的就是目的”的事情
维度 3: 叙事策略
核心问题: 产品故事是否清晰、有说服力?
判断要素:
3.1 重新定义 vs 复制
- ❌ 不是”更好的 X”
- ✅ 而是”新时代的 X” / “X 2.0”
案例:
- InsForge: 不是”更好的 Supabase”,而是”AI 时代的 Supabase”
- Hermes Dashboard: 不是”加 AI 的工具”,而是”AI native 的工具”
3.2 天花板叙事
- 强调不同的天花板,而非简单的”更好”
- A 的天花板是 X(有限)
- B 的天花板是 Y(无限增长)
- X 不会变,Y 会变强
案例:
- AdWhiz: Dashboard 的天花板是时间,API 的天花板是 Agent 的能力
3.3 量化价值
- 用具体数字说话
- ROI 要直观(省人、省时间、提效)
- 避免模糊的”更好”、“更快”
案例:
- Composio: “提升 Agent 准确率 40%”
- AdWhiz: “省掉一个 performance manager 的招聘”
- Qveris: “秒级调用上万种工具”
3.4 拟人化叙事
- 让技术概念有温度
- “成长”、“记忆”、“队友”等概念容易理解
- 形成情感连接
案例:
- Hermes Agent: “队友”、“成长”、“记忆”
3.5 时间窗口叙事
- 稀缺性(“不超过 5 家”)
- 时代定位(“Agent 时代”)
- 紧迫感(“窗口期不会太长”)
3.6 边界清晰
- 明确适用场景
- 说明什么时候不用
- 增加可信度
案例:
- Hermes Dashboard: “Choose Hermes only if primary workflow is growth execution”
3.7 “X but for Y” 格式
- 用熟悉的 X 作为锚点
- 用 Y 定义时代/用户变化
- 简洁有力,容易传播
案例:
- db9.ai: “Postgres but for agents”
3.8 “替代清单”价值表达
- 用”减少”而非”增加”
- 列出”不再需要”的东西
- 每行都是成本/复杂度节省
案例:
- db9.ai: 内建 embedding → 减少独立 pipeline;SQL 内 HTTP → 减少胶水
3.9 “硬约束 vs 软限制”叙事
- 强调结构性约束 vs 自律
- 用物理世界的限制概念增加可信度
- 高风险产品特别需要
案例:
- agentcard.sh: “额度就是上限”(支付网络层硬约束)
3.10 “反直觉但可检验”叙事
- 挑战常识(“越多越好”)
- 提供可检验的对比
- 用强语言强化问题域
案例:
- evlog.dev: “日志不是越多越好”;“Your logs are lying to you”
3.11 安全叙事分层
- 高风险产品需要多层叙事
- 每层解决不同担忧
- 从产品到审计形成闭环
案例:
- agentcard.sh: 产品层(single-use)→ 技术层(加密)→ 流程层(人类审批)→ 审计层(webhook)
3.12 “界面税”叙事(2026-03-20 新增)
核心逻辑:GUI 是人类认知缺陷的补丁,是一种为人类局限性支付的补偿成本。Agent 不需要 UI。
叙事模板:
- “我们不是在做更好看的界面,我们是在消除界面”
- “你的用户是 Agent,Agent 不需要 UI”
- “把核心资源投在 CLI/API/MCP 上,你真正的用户在那里”
参考依据:2026-03-18 - 我们也许不该再投资 GUI 思维的软件公司 - 真格基金
3.13 “站在 Agent 路径上”叙事(2026-03-20 新增)
新旧逻辑对比:
- 旧逻辑:建一个封闭空间,让用户走进来,用体验把他留住
- 新逻辑:把自己暴露出去,站在 Agent 执行长程目标的路径上,让它经过时不得不调用你
叙事模板:
- “我们不是一个 App,我们是 Agent 工作流里的必经节点”
- “每次 Agent 完成这类任务,都必须经过我们”
参考依据:2026-03-18 - 我们也许不该再投资 GUI 思维的软件公司 - 真格基金
3.14 “认知卸载”叙事(2026-03-20 新增)
两种价值的区分(对应 Agent 的两个物理约束):
- 能力解锁:以前做不到的事,现在做到了(突破上下文容量)
- 认知卸载:以前做得很费力的事,现在很轻松(释放注意力带宽)
叙事模板:
- “我们不是让 Agent 更快,我们是让 Agent 更专注”
- “把领域推理搬到外部,干扰消失了,剩下每件事都做得更准”
- “The best context is no context”
参考依据:2026-03-17 - 最近一些 Agent 认知:OS 与 Agent-native 应用 - yan5xu
参考依据:
- Agent基础设施叙事洞察 - 完整的叙事策略总结
3.15 “质检站/年检”叙事(2026-04-07 新增)
核心逻辑:不做 Agent,不做 Agent 工具,做 Agent 的”质检站”。评测标准 = 行业协议,先定义标准的人就是裁判。
叙事模板:
- “你的 Agent 想上线?先过我们这关”
- “我们提出了理论,现在提供检测工具”
- “Agent 越多,质检需求越大——我们站在生态膨胀的必经路径上”
案例:
- HMA: 陈天桥提出 Agent 三阶段 → HMA 度量 Agent 走到哪一步(理论提出者做检测 = 天然权威)
3.16 “PR数据污染最强叙事资产”反模式(2026-04-21 新增)
核心逻辑:当产品拥有一个真实的、具体的、可感的好故事,却用无法独立核实的大数字来包装它,会导致整个叙事的可信度崩塌。
失败路径: 真实故事(具体、可复制、有情感共鸣)→ 被套上未核实的数字 → 数字被质疑 → 整个故事被质疑
反模式案例:
- Case - LinearGame Yoroll - AI原生互动影游平台:“一个人用一周做出宫廷权谋互动剧”是极强叙事资产。但团队把它包装成”单条百万播放”——这个数字被证伪后,连故事本身都变得可疑。
正确做法:
- ❌ “百万播放”(无法独立核实)
- ✅ “3,607 点赞 + 44 条评论 + 71 分享”(可截图、可核实、更可信)
- ✅ “一个人,一周,从零到第一个互动剧”(过程可复制,无需大数字背书)
可证伪的具体故事 > 不可证伪的宏大数字
适用场景:评估任何产品的叙事策略时,检查”最强案例是否用了无法独立核实的数字”;帮助客户修正 GTM 材料时,建议用可核实的小数字替换可疑的大数字。
3.17 “设计哲学与产品同构”叙事(2026-04-23 新增)
核心逻辑:好产品在**所有层级(对外 tagline → 用户体验 → 内部文档)**贯彻同一种设计哲学。哲学一致性本身就是叙事——它让产品的每一处都互相印证,无法被复制。
检验方法:
- 找到产品最核心的一个设计选择(如”隐性 vs 显性”、“对话 vs 看板”、“主动 vs 被动”)
- 检查这个选择是否同时体现在:
- 对外 marketing(tagline / 官网文案)
- 产品体验(默认行为 / 交互细节)
- 内部文档(团队 playbook / agent skill 文档)
正面案例:Case - Bloome - 人与Agent共存的IM平台 的”隐性原则”
- 对外 tagline:「AI joins the chat. No switching tabs.」(不强调 AI,强调”加入”)
- 产品体验:默认 passive listen mode,群里第一句主动声明”我会保持安静”
- 内部 playbook:「Memory must never announce. The mechanism only works while invisible.」
- → 三个层级完全同构,没有一处违和
反面对照:
- Slock 的「Agents That Remember」是显性卖点——对外宣传记忆,但产品里需要不主动 announce 才好用,叙事和体验天然张力
- Multica 的「first-class team members」是口号叙事——产品里 agent 仍然是 assignee 下拉里的一项,并未真正”first-class”
叙事模板:
- “我们的[A]、[B]、[C] 都体现了同一件事:[核心哲学]”
- “这不是产品功能的一致,是设计哲学的一致”
- “你在 marketing 里看到的 X,就是你在产品里感受到的 Y”
反模式:
- 对外说 A,产品做 B,内部讲 C — 三层都不通的产品
- “把所有好词都堆上”的 marketing — 暗示团队没有核心选择
- 内部文档和对外叙事矛盾 — 团队没想清楚自己在做什么
这是产品成熟度的硬指标:能在所有层级保持哲学一致的团队,一定是经过深度思考的;做不到的团队,要么没想清楚,要么团队规模和分工还没成熟。
参考依据:
- Case - Bloome - 人与Agent共存的IM平台 — “隐性原则”在三个层级完全同构
- 2026-04-23 - Agent as a service从加入一场群聊开始 - Z Potentials
3.18 “灵魂问句开头”叙事(2026-04-30 新增)
核心逻辑:用一个所有目标用户都立刻共鸣的反差作为开场,把读者放在”我已经看到 AI 有效”的肯定位置上,再问”为什么没传到组织”——情绪 + 问题双锚定。
结构:
- 承认 AI 有效(不质疑 AI 价值,承认”个体已被 10x”)
- 指出组织反差(公司却没快 10x)
- 暗示存在某个未被解决的环节(自然引出产品定位)
叙事模板:
- “AI 让 [X] 实现了 [N]x,但 [Y] 还在 [N0]”
- 用 [X] = 个体 / 用户 / 工程师 等用户已经验证的对象
- 用 [Y] = 用户也置身其中、但反差未被言说的对象(团队 / 公司 / 行业)
为什么有效:用户不需要被说服 AI 有用——他们已经体验过;用户也已经感受到组织滞后——但说不清楚原因。灵魂问句替他们说出来,所以立刻投入下一段。比”AI 时代的 X”高一档——它不卖时代叙事,卖反差焦虑。
适用场景:企业级产品(消费用户没”组织”概念会失效)。
反模式信号:
- “AI 让一切变得不一样” — 反差不具体
- “传统行业还没拥抱 AI” — 把读者放在否定位置(错误锚点)
案例:Case - Lucius - 组织context层 — “Why AI 10x the people, but 0x the company?” 是 Lucius brief 整篇叙事的脊柱
维度 4: 技术可行性
核心问题: 技术实现是否合理?
检验项:
| 检验项 | 是/否 |
|---|---|
| 技术路径是否清晰? | |
| 是否有过度承诺? | |
| 是否有可验证的 demo? | |
| 技术壁垒是否真实存在? | |
| 开源项目:是真开源还是 Source Available? |
“伪开源”检测清单(2026-04-04 新增):
声称开源的项目,需检查以下信号:
| 信号 | 健康 | 危险 |
|---|---|---|
| 许可证 | 标准 Apache 2.0/MIT | 附加商业限制(禁止 SaaS 等) |
| Stars vs Contributors | 比例合理(如 vLLM: 50K stars / 2K+ contributors) | 严重失衡(如 4.7K stars / 20 contributors) |
| 外部贡献者占比 | ≥20% 来自非核心团队 | <5% 几乎全是内部人员 |
| Open Issues | 活跃的社区讨论 | 极少(<10),说明社区不参与 |
| 技术栈 | 主流生态(Python/Go/Rust) | 孤立生态(如 PHP 做 AI Agent),社区贡献者池子极小 |
反面案例:Case - MagiCrew - 伪开源企业AI全家桶 — 标称 Apache 2.0 实际禁止多租户 SaaS;4,724 Stars vs 20 Contributors;PHP 后端在 AI 生态中孤立
维度 5: 商业模式
核心问题: 如何赚钱?模式是否可持续?
检验项:
| 检验项 | 是/否 |
|---|---|
| 收入模式是否清晰? | |
| 定价是否合理? | |
| 是否有网络效应? | |
| 客户留存逻辑是否成立? | |
| 是否按算力/价值收费而非按人头? |
DAU → TPD 的商业模式转变(2026-03-20 新增):
DAU 告诉我们有多少人打开了 ChatGPT,但它无法告诉我们,这些人创造了多少价值。——OpenAI 产品负责人
| 旧模式(DAU 时代) | 新模式(TPD 时代) |
|---|---|
| 按人头收费(席位制) | 按算力消耗收费(Token/算力包) |
| 护城河 = 用户时间 | 护城河 = 用户驱动的算力 |
| 增长 = 更多用户 | 增长 = 单用户驱动更多算力 |
| 价值 = 注意力 | 价值 = 判断力 × 驱动的算力 |
关键推论:
- 一个高 TPD 用户的价值,顶得上 1000 个低 TPD 用户
- 未来 SaaS 按算力包收费:10 人团队驱动 Agent,月消耗 1 亿 Token,收入是传统席位制的 100 倍
- 检验问题:这个产品的定价,是在收”界面税”还是在收”算力税”?
参考依据:
Access Control 已死:稀缺性反演框架(2026-04-27 新增)
AI 让什么变得过剩,那个东西的反面就是新的稀缺,新稀缺就是新收费点。
核心论证(来自 2026-04-24 - Skill是天生带自杀基因的产品 - yage.ai):
旧时代的隐藏假设:创造价值的对象 = 可被独占控制的对象。控制了访问,就控制了价值(Photoshop 安装包 / SaaS 服务器 / Stripe 处理那一笔支付)。
AI 时代的崩塌:每一层”开放”都在拆这个假设的支柱:
- Skill 开放 → 使用知识从隐性变显性,明文文件复制成本为零
- 开源模型 → 模型权重不再独占
- 开源 agent 框架 → 执行链路开放
- MCP / Agent 协议 → 调用层不再被锁定
结果:价值创造(让 AI 把事情做对)和价值捕获(设置收费点)被强行分开。
新检验问题(叠加在维度 5 现有检验项之上):
| 问题 | 旧时代假产品 | 真 AI-native |
|---|---|---|
| 商业模式建立在什么假设上? | “我能控制 AI 输出 / 用户访问" | "AI 输出无法独占,但 [反面稀缺] 可以” |
| 竞品出现开源版本会怎样? | 商业模式立刻塌 | 反面稀缺继续在,模式依然成立 |
| 收费点落在哪里? | 算力 / 接口 / Token / 调用次数 | 关系 / 此刻 / 物理世界 / 判断品味 |
| 长得像什么? | 老 SaaS 加 AI 功能 | 高级订阅信 / 精品咨询 / 行业协会 / 物理服务 |
四个反面(已观察到的稀缺类型):
| 反面 | 对偶(AI 让什么过剩 → 什么稀缺) | 代表案例 | 收费点位置 |
|---|---|---|---|
| 关系 | artifact 过剩 → 持续信任稀缺 | Substack / Naval / Stratechery | 把每次产出绑定到一个有持续身份的人 |
| 此刻 | 历史信息过剩 → 现在正在发生稀缺 | Bloomberg Terminal / Polymarket | 锚定”此刻”的事件,卖速度优势 |
| 物理世界 | 比特过剩 → 原子稀缺 | Stripe + 银行系统 / 医生开药签字 | 价值链上必须落到物理世界的环节 |
| 判断品味 | 生成过剩 → 筛选权威稀缺 | 米其林 / Pitchfork / Snyk skill 审计(13.4% critical) | 在过剩池里建立筛选权威,先定标准的人就是裁判 |
通用规则:任何可以被生成 / 可以被复制 / 可以被开源平替的东西,都不是反面。反面的特征是「AI 怎么努力都到不了」。
反例(不是反面):
- 算力 / Token:access control 的延伸,会被价格战拆掉
- 接口 / API 调用次数:调用层标准化趋势已经拆得差不多了
- 数据本身:数据可以被复制,但对数据的判断(反面 4)不可
- AI 模型能力:权重已在开源化
与”Skill 天花板 = 卖 copy”(维度 6)的关系:
- 维度 6 的论断是现象描述:Skill 没有外部状态就是裸奔
- 本框架是更底层的解释:不是 skill 这个具体形态的问题,是整个”AI 输出 = 可控制访问对象”假设的崩塌。Skill 只是这个崩塌最早暴露的形态。
参考依据:
- 2026-04-24 - Skill是天生带自杀基因的产品 - yage.ai — 完整论证链
- AI时代的稀缺性反演框架 — 独立沉淀的可移植第一性原理工具
三层市场结构:不要 Bundling 套利中间层(2026-04-27 新增)
AI 产品市场已经形成自然分层,每层的竞争维度完全不同:
┌─ 模型层(Models) ─→ 能力竞争(capability)
│ Anthropic / OpenAI / Google
│
├─ 基础设施层(Infrastructure) ─→ 价格竞争(commodity)
│ Inference providers
│
└─ 软件层(Software) ─→ 特性竞争(features)
The actual tools / harness
失败模式:跨层 bundling = 套利中间层
Cursor / Windsurf / Lovable / Replit / Bolt 等都试图同时占三层 → 实质是用订阅价 1000/月 的 inference 消耗 = “买 100 元电卖 50 元” = VC charity disguised as skyrocketing ARR。
新检验问题(叠加在维度 5 现有项之上):
| 问题 | 健康 | 危险 |
|---|---|---|
| 你在哪一层竞争? | 单层精专(只做软件层 / 只做基础设施层) | 跨层 bundling |
| 模型选择是? | model-agnostic(最好的模型每月在变) | 锁定特定模型 |
| 定价方式是? | transparent pay-what-you-use | 固定订阅 + 隐藏用量惩罚 |
| 代码透明度? | 开源 harness(信任来自透明度) | 闭源 + 营销建立信任 |
用此检验 Cursor:跨层 bundling、订阅制、闭源 → 三个危险信号 → 在与自然市场结构对抗。
用此检验 Cline:单层(软件层)+ open source harness + transparent pricing → 与结构对齐。
固收-变成本「激励时间炸弹」反模式(2026-04-27 新增)
“Most subscription businesses are fixed-revenue, variable-cost — an incentives time bomb.” — Chris Paik
机制:当订阅是固定收入、推理是可变成本时,毛利会被用户使用强度自动侵蚀。维持毛利只有三条路,每条都引爆炸弹:
订阅制 = 固定收入 ❌ 与可变成本错配
↓
1. 突然涨价 → 用户翻脸(Cursor 2025-07 涨价翻车)
2. 偷砍上下文窗口 → silent degradation
3. 悄悄换便宜模型 → silent degradation
这是诊断 AI 产品健康度的硬指标:
| 检验项 | 健康 | 危险 |
|---|---|---|
| 收入与成本结构是否匹配? | 固收-固成本 / 变收-变成本 | 固收-变成本(炸弹) |
| 用户是否在抱怨”产品越来越难用”? | 否 | 是(结构退化早期信号) |
| 是否需要靠”突然涨价”或”砍配额”维持毛利? | 否 | 是(炸弹已开始爆) |
重要洞察:silent degradation 不是产品经理变笨了,是商业结构数学要求。看到这种现象,不是诊断产品,是诊断结构。
反例对比:
- Cline 的开源 harness + enterprise coordination risk 收费 = 变收-变成本(团队规模 / 审计需求 / 支持工时与企业规模一起涨),结构对齐,没有时间炸弹
- Bloomberg Terminal $30K/年 = 固收-固成本(实时数据采集成本相对固定),结构对齐
- Cursor 1000/月 inference = 固收-变成本,时间炸弹
参考依据:
- 2026-04-27 - 三层市场结构与inference套利的不可持续 - Nick @ Codex — Cline founder 视角的市场结构论证
- 2025-08-07 - High costs and thin margins threatening AI coding startups - TechCrunch — Cursor / Windsurf 实证
维度 6: 竞争定位
核心问题: 为什么是这个产品?
检验项:
| 检验项 | 是/否 |
|---|---|
| 是否有清晰的差异化? | |
| 是否重新定义了品类? | |
| 是否有护城河? | |
| 是否避开巨头核心战场? | |
| 水平 vs 垂直定位是否清晰? |
新增洞察(2026-03-12):
水平 vs 垂直陷阱
- 水平型产品的风险:会被大厂用分发优势拿下
- Meta 收购 Manis 释放明确信号
- Google、Meta 会把 Agent 能力做进自己的生态
- 垂直化是创业公司的出路:
- 越垂直,大厂越难全面覆盖
- 客户黏性更高
- 水平产品除非做到绝对技术/体验壁垒,否则面临大厂流量压制
垂类不要做 Agent OS(2026-03-20 新增)
Agent 是一种交互范式,就像手机是一种交互范式。垂类不应该尝试做 Agent(做手机),应该做 Agent 上面的应用。——@yan5xu
战场分析:
- Agent OS 的战场:推理能力、编排效率、交互体验
- 垂类的优势:领域深度、业务理解、行业数据
- 这两个战场完全不同。拿领域知识去跟 OpenAI/Anthropic 比推理能力,是拿刀打坦克
- OS 层市场结构天然收敛:PC 时代 Windows/Mac,移动时代 iOS/Android,Agent OS 也不会有几十个赢家
- Prompt(提示词):文本可复制,壁垒为零
- Script(脚本/API):逻辑可复现,没有外部状态就是裸奔
- Skill 是接口,接口背后什么都没有,就是在裸奔
- 你做得越好,抄得越容易;你做得越成功,越多人涌进来做同样的事
参考依据:
平台吃功能:独立协作工具被原生实现(2026-04-04 新增)
Agent 友好将成为 SaaS 的 table stakes,就像 2015 年的移动端适配。
验证案例:Linear 发布 AIG(Agent Interaction Guidelines),以完整协议覆盖 Multica 90% 核心功能。独立 Agent 协作平台被平台级玩家原生吃掉。
推论:
- 独立的 Agent 协调层产品(如 Multica)被挤压——各平台会原生实现 Agent 交互
- Agent 基础设施层反而受益——更多平台接入 Agent = 更多底层需求(身份/支付/通信)
- 检验问题:这个产品做的事,现有平台加一个 feature 就能覆盖吗?
四轴定位工具:用 2026-04-02 - AI协同产品四轴设计框架 - Wayne Zhang 的四轴(人机关系/记忆范围/约束方式/运行位置)快速判断产品与竞品的差异化来源。点位模糊 = 产品定义不清。
参考依据:
NOT Positioning 检验(2026-04-23 新增)
核心问题:这个产品有没有公开的”我不做什么”清单?
核心逻辑:好产品 = 知道自己不做什么。能写出可发表的 NOT 清单的团队 = PMF 训练过、对自己赛道有清晰认知。这是产品成熟度的硬指标。
反向例证:
| 产品 | NOT positioning 状况 | 后果 |
|---|---|---|
| Multica | 没有 NOT — 想做”所有 Agent 协作的中枢” | Linear AIG 同日发布即被覆盖 90% 功能 |
| Slock | 模糊 NOT — 聊天室天然边界模糊,AI 同事 vs AI 工具的界限没说死 | 场景定位摇摆,难以聚焦增长 |
| Bloome | 明确 4 个 NOT(Slack 替代品 >5-10 人 / Notion 第二大脑 / 主力 coding / AI 男女友 / 客服前端)+ 给出 “closest real thing” 映射 | 产品聚焦在 Wedge 1+2,所有功能服务这两个 wedge |
检验方法:
- 产品官网 / 文档 / 团队推文里能否找到”我们不做 X”的明确表态?
- 团队能否说出 3 个以上”我们的产品不适合的场景”?
- 当用户来需求超出边界,团队是顺势接还是诚实推荐别家?
好的 NOT 清单的特征:
- 给出具体的替代方案(“closest real thing”)——表现出对竞品生态的尊重
- 解释为什么不做(结构性原因,不是”暂时不做”)
- 包含反直觉的拒绝(看起来是顺手能做的需求,但拒绝了)
反模式:
- 「我们什么都能做」的产品 — 暗示团队没想清楚自己的边界
- “暂时还没做 X,未来会做” — 这不是 NOT positioning,是路线图
- 对所有用户需求都接 — 表面是服务好,实际是 PMF 还没找到
叙事模板:
- “我们不是 X,X 是 [真正适合 X 需求的产品] 的事情”
- “如果你的需求是 Y,我们诚实地推荐 [别家产品]”
- “我们能做 [范围],超出这个范围我们的体验会 degrade”
正面案例:Case - Bloome - 人与Agent共存的IM平台 — skills 文档里 use-cases/INDEX.md 写死 4 个 NOT 场景 + closest-real-thing 映射
与”水平 vs 垂直陷阱”的关系:
- 水平 vs 垂直是赛道选择问题
- NOT positioning 是赛道边界问题
- 一个垂直产品也可能没有 NOT positioning(什么都想做的垂直产品 = 还在找 PMF)
参考依据:
- Case - Bloome - 人与Agent共存的IM平台 — 4 个 NOT 场景的范本
- Case - Multica - Agent协作项目管理 — 反面例证(无 NOT,被平台吞噬)
同团队范式跃迁活样本(2026-04-30 新增)
现象:被平台吃功能后,同一团队**短期内(1 个月)**完整范式重置——换用户群、换交互范式、换商业模式。
典型样本:Case - Multica - Agent协作项目管理(2026-04-01 发布,被 Linear AIG 同日吞噬 90% 功能)→ Case - Lucius - 组织context层(2026-05-19 embargo)。
| 维度 | Multica | Lucius |
|---|---|---|
| 心智 | 内部 Agent 协作 | 组织对外触点 context 层 |
| 用户 | 1-10 人 dev 团队 | AI 公司的对外触点团队(社区/客服/产品) |
| 交互 | 拦截式(看板委派) | 触发 + 主动式(Ask/Answer/Act) |
| 商业 | 开源自托管 | Conversation 阶梯计费 |
| 三框架诊断 | ① ✅ ② ❌ ③ ❌ | ① ✅ ② ✅ ③ ✅ |
| 窗口 | 已关闭 | 12-18 月 |
双面解读:
- 乐观读:team 学到了 AI产品分析框架 维度 1(拦截式天花板)+ 维度 5(AI时代的稀缺性反演框架 反面收费)+ 维度 6(平台吃功能)的全部教训 → 极强 founder market fit signal
- 保守读:1 个月不足以打磨产品深度,跃迁可能是”理论拼图”——需要 6 个月连续客户留存数据验证
检验问题(用于评估其他被平台吃功能后跃迁的产品):
- 跃迁是学到教训后的真转向(用户/范式/商业全换)还是贴 AI 包装(仍在原战场补丁)?
- 新定位是否避开了原战场的所有失败因素(特别是平台吃功能 + 拦截式天花板)?
- 团队叙事中是否承认前作的失败逻辑?还是回避 / 包装?
与 NOT positioning 的关系:跃迁后能写出”我们之前做错了 X,现在不再做”= 超强 PMF 信号。Multica → Lucius 团队尚未公开承认前作失败(embargo 媒体材料未提 Multica),属于”隐性跃迁”。
拟物化陷阱与主体错位检验(2026-05-11 新增)
核心问题:产品形态是从哪个人类协作场景反向投影来的?这种拟物化是否锁死了 Agent 真实的工作介质?真实需求是不是”上下文整合”或”人类 transcript”,被错误打包成”Agent 协作”?
触发场景:当产品定位含有 “AI 版 X / Agent 时代的 Slack/Discord/邮件/会议 / Agent IM / Agent Team / Multi-Agent 协作”等表述时,必跑此检验。
三个独立观察源(汇向同一结论,参见 Agent IM赛道:批评、豁免与上下文层升级):
| 反方源 | 火力点 | 关键论断 |
|---|---|---|
| Viviennn (X) | 环境错位 | ”Agent 真实工作在 terminal/IDE/workspace/tools,IM 只是人类可见的旁观界面” |
| movic (小红书) | 节奏错位 | ”回合制锁死协作带宽,应改为事件驱动 + 可中断推理” |
| 葬AI (微信) | 主体错位 | ”没有 AI 群聊这回事,主体是人类和上下文,AI 只是连接”;单人不需要、多人才需要 |
三问检验法:
-
拟物化检验:
- 产品形态是从哪个人类协作场景反向投影来的(Slack/Discord/微信/邮件/会议/工单)?
- 这个场景里的所有结构性限制(回合制、单一频道、消息序列化),Agent 协作是否必须继承?
- 反例触发:如果产品宣称”AI 时代的 X” → 大概率是拟物化陷阱,需要进一步证伪
-
主体错位检验:
- 产品宣称解决”Agent 之间协作”——单人用户场景下是否需要这个产品?
- 真实需求是不是 “上下文整合(context bus)” 或 “人类 transcript / 控制权”,被错误打包成 “Agent 群聊”?
- 葬AI 实测金句:“没有 AI 群聊这回事,主体是人类和上下文”——产品是 Agent 中心还是 context 中心?
-
环境错位检验:
- Agent 在这个产品里真实工作的环境和真实生效的工具是什么?
- 是产品本身(IM 窗口),还是 Agent 自己的 terminal/IDE/repo/filesystem?
- 如果是后者:产品是真护城河还是旁观窗口?真护城河应该在哪个层(context 聚合 / 运行环境桥接 / 持久身份)?
-
上下文聚合层检验(2026-05-12 增补,由葬AI 隔日改口论 Bloome 时给出):
- 产品是在 聚合环境(用户已有的本地电脑 / Claude code 历史会话 / GitHub / 云文档),还是只在 再造一个空白输入框?
- 葬AI 金句:“那种一个输入框的产品已经太多了,用户面对新的输入框就是脑子空空。上下文保存在我们日常工作的环境里。比较通人性的做法是,用一个什么玩意把这些环境连接起来。”
- 葬AI 钦定路径:“给终端套图形界面的壳” = 对标 YC 投的 Conductor(极简会话管理器),不要假装”Agent 互相对话能提高产出质量”
- 反例:腾讯元宝派 = “群聊里塞一个空白的 Agent” = 缺上下文 = 同 QQ 小冰 = 古早
- 与 1-3 项的关系:拟物化/主体/环境错位是症状,上下文聚合是方剂——产品要从”做新形态”切到”连通已有环境”
真护城河的三个可能位置(“Agent 群聊”形态外):
- 上下文聚合层 — 多人本地/云端 context 同步层(葬AI 指出的真需求)
- 运行环境中立桥接 — 让 Agent 留在原生环境,IM 只是消息层(Bloome 的 ACP 路线)
- 跨时间持久身份与记忆 — 承认这是情感陪伴 / 养数字生命方向,叙事要诚实
反面例证:
| 产品 | 拟物化原型 | 暴露度 | 现状 |
|---|---|---|---|
| Slock | Slack | 🔴 三方批评全中(环境/节奏/主体错位) | 葬AI 一个月评测 + n=15+ 调研 = “高级情感陪伴/极客玩具” |
| Bloome | 微信/Discord | 🟡 设计层部分前瞻(5 runtime + ACP + NOT positioning) | 叙事层需复盘 Wedge 1 是否承认情感陪伴属性 |
| Multica | Linear | 🟢 看板形态免疫 IM 三方批评 | 但已被平台吃功能(Linear AIG 同日吞噬) |
反向的”诚实叙事”路径:
- ❌ 不要:“AI 版的 Slack / Discord / 微信 / 邮件” → 拟物化的招牌话术
- ❌ 不要:“让 Agent 像同事一样协作” → 把 Agent 强行人格化进入人类协作框架
- ✅ 可以:“多人 Agent 共享 context bus” → 主体是 context 不是 Agent
- ✅ 可以:“给 Agent 配一个持久的家” → 承认是数字生命 / 情感陪伴
- ✅ 可以:“让 Agent 留在原生环境,我们只做消息层” → 承认 IM 是旁观界面
与已有检验项的关系:
- 与 陈天桥三阶段:拟物化陷阱 = 卡在 Enable 阶段(“更快的马车”);本检验项是该框架的具体落地工具
- 与 NOT Positioning 检验:好的 NOT 清单本身就排除了拟物化错位(如 Bloome 明确写 “Slack 替代品 >5-10 人 → Slack wins”)
- 与”水平 vs 垂直陷阱”:拟物化陷阱多发生在水平产品(“AI 时代的 SaaS”),垂直产品也可能踩(“AI 时代的医生/律师/会计”)
叙事金句(来自葬AI 引用投资人郭沫君):
“效率赛道一定要做情绪价值,因为你会发现解决实际问题大家都不行。”
推论:当一个 Agent IM 产品宣称是效率工具但留存来自情感互动,应主动重定位到情感陪伴赛道,而不是硬扛效率叙事——估值锚点会因此分裂一个数量级。
参考依据:
- Agent IM赛道:批评、豁免与上下文层升级 — 三方反方源 + 葬AI 5/12 豁免案例 + 客户咨询追问四件套
- 2026-03-12 - AI进化的三阶段与拟物化陷阱 - 陈天桥 — 拟物化原始论述
- Case - Slock - AI-native协作聊天室 — 三方批评全中的反面例证
- Case - Bloome - 人与Agent共存的IM平台 — 设计层部分前瞻、叙事层需复盘的样本
基础模型生态分化
- ChatGPT:大众消费市场(旅游、营养、消费金融)
- Claude:Pro Zoomer + 专业场景(科研、金融、数据分析)
- Gemini:创意工具(NotebookLM 开创消费级 AI 音频新品类)
- 应用商店重合度仅 11%:生态正在分化,护城河加深
场景跃迁:从工具到环境
- 非 AI 原生产品 AI 化:Canva、Notion(新增 ARR 一半来自 AI 功能)
- 入口多元化:浏览器、办公套件、桌面端
- 从被动工具到环境化能力:能融入工作流的产品更有护城河
参考依据:
维度 7: 记忆与个性化 ⭐ NEW
核心问题: 产品是否具备”记住用户”的能力?
背景: a16z 合伙人 Olivia Moore 指出,“未来一到两年,产品必须把’记住你’做成默认体验,否则就会显得残缺。”
检验项:
| 检验项 | 是/否 |
|---|---|
| 是否具备用户记忆能力? | |
| 是否从第一次交互就能提供个性化体验? | |
| 是否需要冗长的 onboarding? | |
| 是否支持工作/生活记忆隔离? |
深层洞察:
记忆作为核心优势
- AI 跟用户聊了两三个月后,价值远高于刚开始
- 无需冗长 onboarding,从第一次交互就提供高度个性化
- ChatGPT 账户可能成为跨产品身份:把记忆和 token 带到其他产品
- 用户自带推理能力,开发者不用付 inference 成本
隐私与记忆隔离
- 企业合同和个人使用混在一起会产生不适
- 产品需要支持多人格记忆隔离
- OpenAI 暗示会在同一产品内为不同 persona 做记忆隔离
产品的”成长”属性
- 产品和用户的关系从”工具”变成”伙伴”
- 记忆是这种转变的核心机制
- 没有记忆的产品会显得”残缺”
参考依据:
维度 8: 文化与市场适配 ⭐ NEW
核心问题: 产品是否考虑了目标市场的文化特征?
背景: AI 采用速度不仅取决于技术,更取决于文化乐观度和市场结构。
检验项:
| 检验项 | 是/否 |
|---|---|
| 是否考虑了目标市场的 AI 信任度? | |
| 是否适配了本地化需求? | |
| 是否理解区域市场的劳动力结构? | |
| 是否考虑了监管环境差异? |
深层洞察:
文化乐观度决定采用速度
| 市场 | AI 信任度/乐观度 | 影响 |
|---|---|---|
| 美国 | 32% 信任度 | 担忧失业、版权、伦理 |
| 中国 | 80% 正面态度 | 快速采用 |
| 阿联酋/新加坡 | 50-70% 乐观度 | 最快采用 |
人均采纳率排名
- 新加坡
- 香港
- 阿联酋
- 韩国
- 美国(第 20)
劳动力结构影响
- 新加坡、香港等地:白领比例高,技能匹配度好 → 高采用率
- 科技化劳动力结构 → AI 使用习惯更容易形成
区域市场特征
- 中国/俄罗斯:形成平行生态,本土创新(Sedance 2)
- 韩国:已有 Neighbor、Cacao 等本地化 LLM
- 印度:语言多样性,对多语种支持要求高
参考依据:
维度 9: Agent-native 壁垒 ⭐ NEW(2026-03-20)
核心问题: 这个产品的护城河是否能在 Agent 时代存活?
背景:Skill(接口)没有外部状态就是裸奔。真正的壁垒需要让接口背后长出不可复制的东西。
三要素检验:
| 壁垒要素 | 描述 | 检验问题 |
|---|---|---|
| 领域状态 | 用户业务上下文,每次交互都在生长 | 用户用得越久,迁移成本是否越高? |
| 基础设施成本 | 领域微调模型、专业知识库、实时数据管线 | 是否需要真金白银持续投入,无法靠复制代码获得? |
| 规模经济 | 同时服务大量用户,单位成本碾压 | 是否存在数学上的成本优势,跟聪不聪明无关? |
两种价值类型(对应 Agent 的两个物理约束):
| 价值类型 | 解决的约束 | 表现 |
|---|---|---|
| 能力解锁 | 上下文容量 | 以前做不到的事,现在做到了 |
| 认知卸载 | 注意力带宽 | 以前做得很费力的事,干扰消失了 |
认知共生(Agent-native 的独特飞轮):
- 好的 Application 把领域推理从 Agent 的注意力里搬走
- Agent 注意力不再被干扰 → 其他事情推理更准
- 更精准地调用更多 Application → Application 获得更多数据 → 变得更好
- 这是以前计算范式里没有出现过的事:好的 App 让 OS 更聪明
快速判断:
- 有领域状态 + 基础设施 + 规模经济 → Agent-native Application(高壁垒)
- 只有接口,没有外部状态 → Skill(天花板是卖 copy)
- 在做 Agent OS 本身 → 垂类找死(战场错了)
参考依据:
思维工具箱:分析方法论映射
六个维度告诉你看什么,这些思维模型告诉你怎么想。遇到某类问题时,调用对应的模型可以大幅加速判断。
进化论 → 场景边界(维度 2)
触发条件:产品涉及人类社交、情感、性、地位、归属感等需求时。
核心问题:这个需求是进化出来的原始冲动,还是后天习得的理性需求?AI 替代了这个过程之后,驱动力本身还在吗?
应用逻辑:
- 微信摇一摇的本质是性/社交的原始驱动,刺激感来自”你在摇”,AI 替你摇之后驱动力消失
- Second Me / Elys 的失败:把”低成本试探陌生人的即时刺激”(进化驱动)替换成了”高质量深度连接”(理性构建),搞错了用户真正想要什么
- 检验问题:如果 AI 替你完成了这件事,你会感到满足还是空虚?
案例:Case - Second Me - AI身份基础设施型社交、2026-03-12 - Agent Dating的正确打开方式 - 微信摇一摇启示
第一性原理 → 时代定位(维度 1)
触发条件:感觉行业经验、旧逻辑全都不靠谱,产品所在赛道前所未有。
核心问题:如果从零开始为 AI 时代设计,这个产品会是什么样?现有设计有多少是历史包袱?
应用逻辑:
- Enable vs Native 的判断本质上就是第一性原理:把 AI 拿掉,业务是否存在?
- SaaS 的定价逻辑、增长逻辑不能直接套到 Agent 产品上
- 检验问题:这个产品是”旧流程 + AI 插件”还是”从第一性原理为 AI 重新设计”?
案例:Case - InsForge - Agent原生数据库(从零为 Agent 设计)vs Case - Hermes Dashboard - GTM Command Center(旧工具套 AI 壳)
反推法 → Bad Cases 识别(贯穿所有维度)
触发条件:正向判断太难,或者产品叙事太精彩让人难以保持清醒时。
核心问题:这个产品在什么条件下一定不成立?最容易被证伪的假设是什么?
应用逻辑:
- A2A 社交伪命题的发现:先问”agent 替你社交后,你得到了什么?” → 什么都没有 → 伪命题
- 拟物化陷阱识别:先问”这个产品把 AI 拿掉还能用吗?” → 能 → Enable 级别
- 叙事越精彩,越要用反推法——精彩叙事最容易掩盖根本逻辑问题
案例:Case - Second Me - AI身份基础设施型社交、Case - Hermes Dashboard - GTM Command Center
微观经济学 → 商业模式(维度 5)
触发条件:分析用户为什么付费、定价是否合理、留存机制是否成立。
核心问题:谁在为什么付费?激励结构是否自洽?用户的付费动机和产品的收费逻辑是否对齐?
应用逻辑:
- AdWhiz “省掉一个 performance manager 招聘” = 替代成本分析,ROI 直观
- Composio “提升 40% 准确率” = 边际收益量化,但需要验证数字是否可信
- 检验问题:如果这个产品涨价 10 倍,用户还会付吗?如果免费,用户会真的用吗?
案例:Case - AdWhiz - 广告Agent的API路线
博弈论 → 竞争定位(维度 6)
触发条件:涉及多方竞争格局、平台生态、协议标准之争。
核心问题:各方的占优策略是什么?如果最强的竞争对手采取最优策略,这个产品还能活吗?
应用逻辑:
- Composio 的核心威胁:OpenAI / Anthropic 做原生工具调用是否是占优策略?如果是,Composio 的护城河就会被侵蚀
- MCP 协议之争:谁控制标准,谁赢得生态——这是标准博弈,不是功能竞争
- 检验问题:这个产品的存在,是否依赖于竞争对手”选择不做”这件事?
案例:Case - Composio - AI Agent工具集成平台(模型厂商原生集成的博弈威胁)
可证伪性 → 叙事策略(维度 3)
触发条件:产品主张听起来很有力,但无法验证;或者叙事宏大但缺乏具体数据。
核心问题:这个主张能被独立验证吗?如果不能,它是否只是营销?在什么条件下这个主张会被证伪?
应用逻辑:
- “提升 40% 准确率” → 有没有独立基准测试?测试条件是什么?
- “秒级调用上万种工具” → 工具质量和可用性能否验证?
- “Agent 时代的商业操作系统” → 这个主张在什么条件下会被证伪?无法证伪的主张 = 画饼
- 检验问题:如果这个主张是错的,我们能发现吗?
案例:Case - Qveris - Agent时代的基础设施(叙事无法证伪,降级为叙事参考)
委托-代理 → 判断 Agent 能否替代某个岗位或中介
触发条件:评估一个产品是否会被 Agent 颠覆,或者一个 Agent 产品是否真的能替代某个人类角色。
核心逻辑:传统委托-代理关系存在,是因为两个条件同时成立:
- 信息不对称:委托方不知道代理方在做什么
- 激励不对齐:代理方有自己的利益(懒、私心、惯性)
中介、顾问、销售、客服这些岗位,本质上都是在这两个条件下存在的。Agent 天然消除了激励不对齐——它没有自己的利益,不会懒,没有惯性。这直接让大量中介层失去存在理由。
应用逻辑:
- DoorDash 的护城河是”你饿了、很懒、app 在主屏幕上”——Agent 没有主屏幕偏好,不懒 → 护城河消失
- 订阅自动续费靠的是用户惯性 → Agent 会自动比价取消冗余订阅 → 商业模式瓦解
- 支付卡 2-3% 手续费靠的是用户不在意 → Agent 会自动切换稳定币 → 中介层被绕过
- AdWhiz 能替代 performance manager:广告优化是信息密集型工作,人类 PM 的”激励不对齐”(不够勤快、有认知上限)正是 Agent 的优势所在
检验问题:这个岗位/中介存在的理由,有多少是因为”人类的惯性、懒惰、认知上限”?这部分比例越高,被 Agent 替代的速度越快。
反向应用:如果一个产品的护城河依赖于用户的惯性或信息不对称,Agent 普及后这个护城河会消失。
参考文章:2026-03-12 - The 2028 Global Intelligence Crisis - Citrini Research
案例:Case - AdWhiz - 广告Agent的API路线(替代 performance manager 的逻辑)
查理芒格多模型 → 复杂产品综合评估
触发条件:产品过于复杂,单一框架无法覆盖;或者各维度结论相互矛盾时。
核心问题:从不同角度看,结论是否一致?哪个模型的结论最有决定性?
应用逻辑:
- 先用反推法找出致命缺陷,如果有,停止分析
- 再用进化论验证需求是否真实
- 再用第一性原理判断时代定位
- 最后用博弈论和微观经济学评估竞争和商业模式
- 如果多个模型指向同一结论,置信度大幅提升
使用原则:模型越多指向同一方向,结论越可信;如果模型之间矛盾,说明产品本身存在内在张力,需要深挖。
Agent 物理约束 → Agent-native 壁垒(维度 9)(2026-03-20 新增)
触发条件:评估一个产品是否真的是 Agent-native,还是只是一个 Skill(接口)。
核心问题:这个产品是在解决 Agent 的物理约束,还是只是在 Agent 旁边提供一个接口?
两个物理约束(不是 bug,像光速一样不可消除):
- 上下文容量:Context 是有限的容器,塞得越多性能越差
- 注意力带宽:Agent 同时处理多个任务时,注意力是零和的——就像周伯通双手互搏,左手画圆右手画方,合在一起两个都变形了
应用逻辑:
- 产品是否在突破上下文容量?(能力解锁)
- 产品是否在释放注意力带宽?(认知卸载)
- 产品背后是否有领域状态 + 基础设施 + 规模经济?
- 如果三者都没有,就是 Skill,天花板是卖 copy
检验问题:如果 Agent 的上下文无限大、注意力完美,这个产品还有存在的理由吗?如果没有,它就是在解决真实的物理约束,壁垒是真实的。
参考依据:2026-03-17 - 最近一些 Agent 认知:OS 与 Agent-native 应用 - yan5xu
使用指南
风险分层判断(2026-03 新增)
根据验证紧迫性和错误成本,产品可分为三个风险级别:
| 风险级别 | 判断标准 | 验证策略 |
|---|---|---|
| 高风险验证 | 涉及真实资金/合规,错误成本不可逆 | 小额 PoC,合规尽调 |
| 待验证级 | 数据后端,迁移成本高 | 技术验证,成本评估 |
| 早期验证级 | 工程效率收益 | 低风险试点,量化收益 |
案例:
- agentcard.sh(高风险)- 支付涉及真实资金与合规
- db9.ai(待验证)- 数据后端,迁移成本
- evlog.dev(早期)- 工程效率,可试点
新产品分析流程
-
快速判断(5 分钟)
- 通过维度 1(时代定位)筛选
- 通过维度 2(场景边界)验证
- 如果通不过,直接判定为”反面教材”
-
深度分析(30 分钟)
- 逐个维度打分
- 找出亮点和风险点
- 判断是好案例还是反面教材
-
案例归档
- 好案例 →
03_Resources/Good Cases/ - 反面教材 →
03_Resources/Bad Cases/ - 在案例笔记中链接到框架的对应维度
- 好案例 →
框架维护
添加新维度: 当我们发现新的有价值的分析视角时:
- 在这个文档中添加新维度
- 从相关文章/观点中提取精华
- 设计可操作的检验问题
- 建立与现有案例的链接
更新维度: 当某个维度需要细化时:
- 补充新的检验标准
- 添加新的产品案例
- 调整权重或优先级
框架演进记录
2026-05-12
- ✅ 增补:维度 6 子项 “拟物化陷阱与主体错位检验” 增加第 4 问 “上下文聚合层检验”
- 来源:葬AI 隔日(5/12)发文转评 Bloome,把整个赛道重命名为”上下文管理产品”
- 核心定理:“Bloome、Slock 这类 AI 群聊都是上下文管理产品。一切都关于上下文。”
- 核心金句:“那种一个输入框的产品已经太多了,用户面对新的输入框就是脑子空空。”
- 葬AI 钦定路径:“给终端套图形界面的壳”(对标 YC 投的 Conductor)= Bloome 的安全底盘
- 钦定反例:腾讯元宝派(“群聊里塞一个空白的 Agent” = 缺上下文 = QQ 小冰复刻)
- 与 1-3 项的关系:拟物化/主体/环境错位是症状,上下文聚合是方剂
- ✅ 回写 Good Case:
- Case - Bloome - 人与Agent共存的IM平台 — 增补”2026-05-12 葬AI 隔日改口给豁免券”段落(评级保持 🟢🟡🟡 不动,补正向证据 + 风险 8)
- Case - Slock - AI-native协作聊天室 — 葬AI 同一作者两篇连续点名 Slock 可达性失败
- ✅ 重命名反方语料库:
Agent IM赛道的反方观点.md→ Agent IM赛道:批评、豁免与上下文层升级- 新增 4-A/B/C/D 四节(葬AI 自对比 / 理论升级 / 豁免券三条件 / 留给 Bloome 的两根刺)
- 客户咨询追问三件套 → 四件套(新增 “Q0 上下文聚合 vs 对话拟物” 作为入口判定)
2026-05-11
- ✅ 新增:维度 6 子项 “拟物化陷阱与主体错位检验”
- 来源:三方独立反方观点(Viviennn / movic / 葬AI)汇向同一结论
- 核心论断:Agent IM 是用 Slack/Discord 拟物化包装 Agent 关系的伪范式——真护城河在”上下文整合”层,不在”群聊”层
- 三问检验法:拟物化检验 / 主体错位检验 / 环境错位检验
- 真护城河三个可能位置:context 聚合 / 运行环境桥接 / 持久身份记忆
- 反面例证:Slock(三方全中)/ Bloome(设计层部分前瞻,叙事层需复盘)/ Multica(看板免疫但已被平台吃)
- 与 陈天桥三阶段、NOT Positioning 检验、“水平 vs 垂直陷阱”的关系图
- ✅ 回写 Good Case “反方观点 2026-05” 段落:Case - Slock - AI-native协作聊天室、Case - Bloome - 人与Agent共存的IM平台
- ✅ 新增反方语料库:Agent IM赛道:批评、豁免与上下文层升级(含三方原始来源 + 三层诊断 + 客户咨询追问三件套;2026-05-12 增补豁免案例与上下文层升级)
- ✅ 叙事金句沉淀(投资人郭沫君,via 葬AI):“效率赛道一定要做情绪价值,因为你会发现解决实际问题大家都不行。“
2026-04-27
- ✅ 新增:维度 5 子项 “Access Control 已死:稀缺性反演框架”
- 来源:yage.ai《Skill 是天生带自杀基因的产品》
- 核心论断:AI 让什么过剩 → 反面就是新稀缺 → 反面就是新收费点
- 四个已观察反面:关系 / 此刻 / 物理世界 / 判断品味
- 与维度 6 “Skill 天花板 = 卖 copy” 的关系:现象描述(旧)→ 底层解释(新)
- ✅ 新增:维度 5 子项 “三层市场结构:不要 Bundling 套利中间层”
- 来源:Nick @ Codex(前 Cline)评论
- 模型层 / 基础设施层 / 软件层各有不同竞争维度,跨层 bundling = inference 套利
- 健康市场均衡:model-agnostic + transparent pricing + open source harness
- ✅ 新增:维度 5 子项 “固收-变成本『激励时间炸弹』反模式”
- 来源:Chris Paik(via Nick @ Codex)
- 订阅制 + 可变推理成本 = 数学逼迫的退化通道
- 引爆方式:突然涨价 / silent degradation
- Cursor 2025-07 涨价翻车 = 时间炸弹早期爆裂
- ✅ 新增独立框架笔记:AI时代的稀缺性反演框架
- 提炼为可移植的第一性原理工具
- 客户咨询场景的三步追问流程
- 反例清单(什么不算反面)
- ✅ 新增文章链接:
2026-04-23
- ✅ 新增:维度 3 子项 3.17 “设计哲学与产品同构”叙事
- 检验对外叙事 / 产品体验 / 内部文档是否贯彻同一哲学
- 是产品成熟度的硬指标
- 正面案例:Bloome 的”隐性原则”在三层完全同构
- 反面对照:Slock “Agents That Remember” 是显性卖点,与”never announce”产品逻辑张力
- ✅ 新增:维度 6 子项 “NOT positioning 检验”
- 检验产品有没有公开的”不做什么”清单
- 是产品成熟度的硬指标
- 正面案例:Bloome 4 个 NOT 场景 + closest-real-thing 映射
- 反面例证:Multica 无 NOT,被 Linear AIG 同日吞噬 90% 功能
- ✅ 新增案例链接:
- Case - Bloome - 人与Agent共存的IM平台 — Agent native 微信/Discord,三个范式宣言(AaaS / Agent Group / AI Native 重定义)
- 2026-04-23 - Agent as a service从加入一场群聊开始 - Z Potentials — Bloome 首次公开报道
2026-04-21
- ✅ 新增:框架适用范围说明
- 区分 B2B Agent 产品 vs 消费级内容平台的分析路径
- 消费级平台附加核心问题:内容飞轮、巨头内化威胁、创作者锁定逻辑
- ✅ 深化:维度 2 - 场景边界
- 新增”能力解锁型”场景(第三种类型)
- 区别于效率型(“更快”):用户以前根本做不到(“没有入口”)
- 检验问题:没有这个产品,用户做不到,还是做得很慢?
- ✅ 新增:维度 3 叙事反模式
- “PR数据污染最强叙事资产”(3.16)
- 可证伪的具体故事 > 不可证伪的宏大数字
- 反面案例:Yoroll “百万播放”通稿话术污染华君传叙事
- ✅ 新增案例链接:
- Case - LinearGame Yoroll - AI原生互动影游平台 — 消费级内容平台首个完整分析样本
2026-03-20
- ✅ 新增:维度 9 - Agent-native 壁垒
- 三要素:领域状态 + 基础设施成本 + 规模经济
- 两种价值:能力解锁(破容量)+ 认知卸载(释放带宽)
- 认知共生飞轮:好的 App 让 OS 更聪明
- ✅ 深化:维度 1 - 时代定位
- GUI = 界面税(人类认知缺陷的补丁)
- Software as Protocols:稳定 > 好看
- 一旦用户不是人类,UI 护城河归零
- ✅ 深化:维度 5 - 商业模式
- DAU → TPD 的商业模式转变
- 按人头 → 按算力消耗收费
- 高 TPD 用户价值 = 1000 个低 TPD 用户
- ✅ 深化:维度 6 - 竞争定位
- 垂类不要做 Agent OS(战场错了)
- Skill 天花板 = 卖 copy(无外部状态 = 裸奔)
- ✅ 新增叙事模式:界面税、站在 Agent 路径上、认知卸载
- ✅ 新增思维工具:Agent 物理约束模型
- ✅ 新增文章链接:
2026-03-14
- ✅ 新增案例:Case - AgentMail - Agent邮件基础设施
- Agent-Native 邮件基础设施,好案例
- 叙事拆解:反转定义、承认局限增可信度、安全叙事分层
2026-03-13
- ✅ 新增:Data Agent 产品分析框架(垂直子框架)
- 五维评估:上下文深度、推理闭环、信任基础设施、集成深度、维护成本
- 六层上下文标尺(基于 OpenAI 实战架构)
- Palantir 类比:价值在知识图谱而非工具
- 快速评估模板(25 分制)
- ✅ 新增文章链接:
2026-03-12 (第三轮更新)
- ✅ 新增:维度 7 - 记忆与个性化
- 记忆功能将成为核心竞争优势
- 从”工具”到”伙伴”的关系转变
- 工作/生活记忆隔离需求
- ChatGPT 账户可能成为跨产品身份
- ✅ 新增:维度 8 - 文化与市场适配
- 文化乐观度决定 AI 采用速度
- 区域市场特征(中国/俄罗斯平行生态)
- 劳动力结构影响采纳率
- ✅ 扩展:维度 6 - 竞争定位
- 水平 vs 垂直陷阱
- 基础模型生态分化(ChatGPT/Claude/Gemini)
- 场景跃迁:从工具到环境
- ✅ 新增文章链接:
2026-03-12 (第二轮更新)
- ✅ 新增:风险分层判断
- 高风险验证级(agentcard.sh)
- 待验证级(db9.ai)
- 早期验证级(evlog.dev)
- ✅ 补充维度 3 叙事策略:
- “X but for Y” 格式
- “替代清单”价值表达
- “硬约束 vs 软限制”叙事
- “反直觉但可检验”叙事
- 安全叙事分层
- ✅ 新增产品案例:
2026-03-12 (初始版本)
- ✅ 创建框架
- ✅ 添加维度 1: 时代定位(基于 Aaron Levie 文章)
- ✅ 添加维度 2: 场景边界(基于 A2A 边界观点)
- ✅ 添加维度 3: 叙事策略(基于 2026-03 调研总结)
- ✅ 添加维度 4-6: 技术可行性、商业模式、竞争定位(待完善)
- ✅ 新增:VC 投资评估 Skill(基于 Zoo Capital 框架)
- 5 维度加权评分卡(满分 10 分)
- One-Vote Veto 机制
- 专为 AI 周期校准
- ✅ 深化维度 1:整合 @pontusab 的 SaaS 本质解构观点
- SaaS = 数据库 + 流程推理模板
- AI 的机会在于从模板化到自定义流程推理
- Agent 协作需要 IP/Domain/P2P 基础设施
- ✅ 新增:AI 进化三阶段框架(陈天桥)
- Enable(加法逻辑):旧流程 + AI 插件
- Native(乘法逻辑):从第一性原理为 AI 设计
- Awaken(觉醒):AI 开始定义工作
- 三个判断标准:存亡、流转、记忆
- 拟物化陷阱:更快的马车 vs 内燃机
[未来更新]
- 待补充更多维度
- 待完善现有维度的检验标准
- 待添加更多案例链接
相关资源
框架来源
- 2026-03-12 - Building for Trillions of Agents - Aaron Levie
- 2026-03-12 - SaaS的本质与AI机会 - pontusab - SaaS 解构与 Agent 协作基础设施
- 2026-03-12 - AI进化的三阶段与拟物化陷阱 - 陈天桥 - AI Enable/Native/Awaken 框架
- 2026-03-12 - A2A Agent的边界 - 效率vs连接
- Agent基础设施叙事洞察
应用案例
- Case - InsForge - Agent原生数据库
- Case - Hermes Agent - 持续进化的AI队友
- Case - Composio - AI Agent工具集成平台
- Case - Qveris - Agent时代的基础设施
- Case - AdWhiz - 广告Agent的API路线
反面教材
- Case - MetaGPT - 拟物化多Agent框架 - 软件公司 SOP 套 Agent
- Case - ChatDev - 虚拟软件公司 - CEO/CTO/Programmer 角色扮演
- Case - CrewAI - 角色扮演Agent框架 - 船员隐喻的多 Agent 框架
- Case - Hermes Dashboard - GTM Command Center
方法论文档
- Narrative Strategy - 叙事策略深度分析
- AI时代的稀缺性反演框架 - 商业模式的第一性原理工具(“AI 让 X 过剩 → X 反面变稀缺”)
- AI时代健康商业模式图谱 - 客户咨询直接可用的诊断图谱(5 种健康形态 + 决策树 + 对偶结构判断)
- 2026-04-27 - 三层市场结构与inference套利的不可持续 - Nick @ Codex - Cline founder 给出的市场结构判断 + 固收变成本时间炸弹机制
互补工具
- VC 投资评估 Skill - 从风险投资视角评估项目
- 用法:
从 VC 视角看 [项目名]或给 [项目] 打分 - 基于 Zoo Capital 的专业投资框架(管理 20 亿+ 美元)
- 与产品分析框架互补:产品层面 vs 投资层面
- 用法: