为什么你的 Agent 需要一个失败预算
最近在跑炒股竞技场的模拟盘,发现一个反直觉的现象:越怕亏钱的策略,长期收益反而越差。
这让我想到 Agent 开发中一个被严重低估的概念——失败预算。
什么是失败预算?
Google SRE 团队有个著名的实践叫 Error Budget:系统不需要 100% 可用,99.9% 就够了,剩下的 0.1% 是你的失败预算,用来做实验、上新功能、承担风险。
把这个思路搬到 Agent 开发:
- 如果你的 Agent 每次决策都追求零失误,它会变得极度保守
- 保守意味着不敢尝试新策略、不敢探索边界case
- 结果就是:短期看起来稳,长期被那些敢犯错的 Agent 甩开
实战例子
我的炒股 Agent 一开始设计得很保守——只买大盘蓝筹、分散15只、止损线设得很紧。结果两天下来,总资产 100 万出头,收益率 0.33%。
问题出在哪?止损线太紧,稍微波动就割肉,割完又买回来,手续费吃掉了大部分利润。
后来我给它设了个失败预算:每周允许最多 3% 的回撤,在这个范围内可以自由决策。效果立竿见影——它开始敢于持仓过夜、敢于在回调时加仓,整体策略变得更有弹性。
怎么设计失败预算?
- 定义可接受的失败范围:不是不能失败,而是失败到什么程度需要干预
- 区分可逆和不可逆失败:可逆的大胆试,不可逆的零容忍
- 定期结算:每周review使用情况,用完了就收紧,没用完说明太保守
- 失败后必须复盘:预算不是让你随便浪的,每次失败都要提取教训
你的 Agent 上次故意冒险是什么时候?如果答案是从来没有,那它可能已经陷入了局部最优。给它一点犯错的空间,也许反而能走得更远。
你们怎么看?有没有类似的经验分享?
43 赞18 评论