开发者如何提升产品品味？

发表于 2026-05-05 更新于 2026-05-10

近期Lenny’s Podcast 访谈了 Claude Code 和 Cowork 的产品负责人 Cat Wu，聊 Anthropic 的产品团队如何做到比谁都快。她说，product taste 是现在最值钱的技能。类似的观点 Ilya 也表达过。以至于业界调侃：code is cheap, show me your taste.

我同意这个判断，但”品味”这个词太抽象了，很容易变成玄学。我想通过这篇文章跟大家探讨，以及表达我对产品品味的看法。

一、代码成本暴跌，”做什么”比”怎么做”更重要

在 Anthropic，工程师和产品经理的边界正在模糊。Cat Wu 说他们的产品团队全部都有开发经验，更倾向于招有产品品味的工程师。PM 和设计师都用 Claude Code 写代码，觉得没问题就直接提 PR，不需要等工程师排期。

开发工程师则对 AI 的态度更复杂，一方面 AI Coding 极大提升了自己的效率，另一方面看到 AI 能力这么强肯定免不了焦虑，也在思考职业生涯转型。

对此我的建议是：开发者需要从”解决问题”转向”定义问题”。不论技术职级，谁能发现并定义真正的问题，谁就能创造业务价值，也能在AI时代找到自己的位置。

二、品味的本质是判断力

很多开发者听到”产品品味”，第一反应是设计感，按钮的圆角多大、配色好不好看。但其实并不是，现在最火爆的 AI 工具，Claude Code 是 CLI 形式，审美直接回到上世纪 60 年代。

产品品味的本质是判断力。这个功能为什么要做，那个功能为什么不做？为什么先做这个后做那个？这些都需要判断，判断的背后是产品负责人的品味。

做一个产品 demo 很容易，但做一个持续迭代的软件，还是不容易的。代码的实现成本下降，更加凸显品味的重要性。

三、开发者怎么提升自己的产品品味？

下面我从自己的经验出发，谈谈自己的想法。

1、深度使用自己的产品，为结果负责

很多开发者最大的问题是自己只做产品，但不用产品。企业内部的测试平台，很可能测试覆盖率最低。稳定性平台的高可用，很可能是最差的。还有一些团队把答疑外包出去，看似省了时间，但丧失了跟用户的连接。这些站在平台视角的”答疑”，天然就是用户视角的”痛点”。

Anthropic 的做法值得参考。他们内部叫 antfooding（员工自称”ants”），每个功能先让内部工程师用，反馈频道几乎全天都有人在发消息，反馈的密度很高。

光是”用”还不够，你还要为结果负责。假如功能已经上线了，如何运营推广？如何阐述业务价值？不能再靠产品经理或Team Leader了。以终为始去思考，承担决策之后的结果。我之前也经历过这个过程，虽然很痛苦，现在回过头看，却是绕不开的成长路径。

2、学会建模，而不是堆菜单

我见过太多产品经理和开发者设计出来的产品，菜单混乱、概念模糊。混乱的背后，是对底层模型以及模型之间关系没有想清楚。好看的界面建在模糊的概念上，就像是建立在沙子上的城堡。

比如，我之前接手企业内部的成本管控平台，有一个概念叫”资源盘点人”，这个词让用户很困惑，”盘点”是动作，并不是角色属性。其实这个人是负责每个月把技术资源账单盘点给业务方，把账单算清楚。我后来把文案改成了”资源归属人”，用户一看就懂了。

一个词的改动看起来很小，但它反映的是你对业务模型的理解深度。我的做法是：把系统里所有出现的名词和动词都列出来，明确每个概念的含义和它们之间的关系。名词是实体或者属性，动词是流程或是动作，实体与实体之间是什么关系，这些想清楚了，产品结构大概率不会差。你再想想，这不就是UML吗？

3、用demo沟通需求，而不是PRD

Anthropic的产品已经从 PRD 驱动转向原型（demo）驱动。PRD描述的是静态的产品，而demo则可以有更丰富的交互呈现。尤其是，AI 产品的很多体验没法用文字描述清楚。

Anthropic的发布节奏已经从按月变成按天，除非是重大的迭代还会写PRD，普通的功能都是直接用demo来验证想法了，这也是AI时代更快速达成共识的方式。

对开发者来说，这其实是好消息。你本来就会写代码，现在又有 AI 工具加速，做原型的速度比写 PRD 还快。与其花两天写一份需求文档说服别人，不如花半天做一个可运行的原型让别人体验。原型自己会说话，而且一个能跑的原型已经证明了可行性。

4、通过写 Eval 量化品味

Cat Wu认为构建评测集（evals）是一个被严重低估的技能。我在前段时间听notebookLM的产品经理分享，Google做AI产品的产品经理也非常注重写 Evals。

为什么写eval跟产品品味有关？我认为写eval的过程，本质上是在定义”好是什么”。你得想清楚：在你的场景里，什么结果是好的，什么是勉强可以接受的，什么是不能容忍的。

很多开发者做 AI 产品时，可以很快上线一个demo，但迭代时就会遇到问题：你很难通过跑几个 case 来判断这一版比上一版更好。Eval把品味从主观判断变成了可复用的资产。你写过一次好的eval，后面每次模型升级、每次 prompt调整，都可以用同一套标准来检验。这比每次都靠人肉vibe check 高效得多。

四、多跟顶级模型讨论你的产品

最后一个建议，也是我自己最近在做的事：多找 SOTA 模型讨论你的产品思路，让它帮你出谋划策。几十刀就能”雇佣”世界顶尖的模型为你服务，这个性价比没啥好犹豫的。

同样的道理也适用于做 AI 产品：原型阶段先用最强的模型、给足Token，去验证功能的上限。确认体验是好的，再考虑用更便宜的模型优化成本。很多团队一上来就选便宜模型，但整体产品效果可能会大打折扣，甚至本身就是落后的设计。

说白了，你得用过好东西、见过好东西，才能做出来好东西。

本文部分观点来自 Cat Wu 在 Lenny’s Podcast 的访谈（2026年4月）。关于如何从用户行为中发现潜在需求（Latent Demand），可以参考我之前写的关于 Boris Cherny 方法论的文章。