DevGhost はどのように工数を推定するか

最終更新 2026年6月6日

DevGhost は、コード変更の背後にある認知的工数——変更行数やキーボードに向かった時間ではなく、作業がどれだけ難しかったか——を推定します。推定値は、コードベースを把握し AI を使わない中級開発者（経験 3〜4 年）が必要とする時間で表されます：コードを書き、手作業でテストし、レビューで修正する時間です。会議、計画、レビュー待ちは意図的に除外します。

1 回の AI 呼び出しではなく、パイプライン

工数は単一のモデル呼び出しの出力ではありません。まず、言語モデルが実際の変更——追加、削除、再構築された内容——を読み、行数やコミット数を数えるのではなく、基準開発者にとっての難度を判断します。その上に、決定論的なルールベースの層が動作し、単一のモデルの推測が結果を左右しないようにします。

決定論的な層

ルール層は、慎重なレビュアーが行うであろう作業を行います：

各変更の性質を分類し、難度の高い作業——インフラ、データ移行、セキュリティ——を個別に認識します。
機械的・生成された変更を除外します：大量の検索置換、生成または移動されたコード、フォーマット整形。
一連の補正ルールとガードレールを適用し、単一のモデルの推測が結果を左右できないようにします。
大きな、または複合的なコミットを 1 つの塊として採点せず、より細かく分解します。

工数を時間に分散する

単一のコミットの工数は最大 5 稼働日に分散され、1 日あたり最大 5 時間の生産的な時間に制限されます。そのため、1 つの大きなマージが特定の 1 日の見え方を歪めることはなく——Ghost% に供給される日次の数値は現実的なまま保たれます。

一貫性と較正

同じ基準が全員に自動的に適用されます。各コミットは一度だけ評価され、結果は固定されます。これが数値を比較可能かつ再現可能にしています。

アルゴリズム層は、実際のエンタープライズ開発から得た経験的なパターン——見た目より高くつく変更と、規模のわりに安価な変更——をエンコードしており、それらのルールは基準となる推定値と照合されます。システムは行数を数えるツールというより、作業を評価する経験豊富なテックリードのように振る舞います。

工数から Ghost% へ

次に、日次工数を Ghost 基準——稼働日あたり 3 時間の生産的な時間——と比較して Ghost% を算出します。これは AI 普及前の基準に対するチームの成果です。推定値は確率的であり、個人を測定するものではありません。

Ghost% とは？ →