假设你一天消耗 100M input tokens + 10M output tokens,缓存命中率 99.82%(这是 Reasonix 实测能达到的数字),账单约 ¥22。同一份工作量,如果没有任何缓存优化,按 DeepSeek V4-Flash 定价算大约 ¥120——一天省 ¥98,一个月就是 ¥2,940。
来源是 DeepSeek 官方定价:V4-Flash 命中价 ¥0.02/M,未命中 ¥1/M,输出 ¥2/M。这篇文章聊聊:一个开源编程 Agent 是怎么把 DeepSeek 的缓存机制“焊”进自己的主循环,从而把 token 成本压到接近物理下限的。