DevGhost 如何估算投入
最后更新 2026年6月6日
DevGhost 估算代码改动背后的认知投入——工作有多难,而不是改了多少行或某人在键盘前坐了多久。该估算以一位熟悉代码库、不借助 AI 的中级开发者(3–4 年)所需的小时数表示:写代码、手动测试以及在评审中修复它。它有意不计入会议、规划和等待评审。
是一条流水线,而非一次 AI 调用
投入并非单次模型调用的产物。首先,一个语言模型读取真实的改动——新增、删除和重构了什么——并判断它对参照开发者的难度,而不是数行数或提交数。在此之上运行一个确定性的、基于规则的层,防止任何单次模型猜测左右结果。
确定性层
规则层做的是一位细心审阅者会做的工作:
- 对每个改动的性质进行分类,并单独识别高风险工作——基础设施、数据迁移、安全。
- 过滤掉机械性和生成的改动:大规模查找替换、生成或移动的代码,以及格式化。
- 应用成套的修正规则和护栏,使单次模型猜测无法左右结果。
- 将大型和组合提交拆分得更细,而不是把它们当作一整块来评分。
将投入分摊到时间上
单个提交的投入会分摊到最多五个工作日,并以每天五个有效小时封顶,这样一次大型合并就不会扭曲单日的图景——而喂给 Ghost% 的每日数字也保持现实。
一致性与校准
同一套标准被自动地应用于每个人。每个提交只被评估一次且结果固定,正是这一点让数字可比且可复现。
算法层编码了来自真实企业开发的经验性模式——哪些改动比看上去更费力,哪些尽管体量大却很廉价——并将这些规则与参照估算进行核对。系统的行为不像一个行数计数器,更像一位评估工作的资深技术负责人。
从投入到 Ghost%
随后,每日投入会与 Ghost 基准——每个工作日三个有效小时——进行比较,得出 Ghost%,即团队相对于 AI 之前基线的产出。这些估算是概率性的,并非对任何个人的衡量。

