よくある質問

DevGhost がどのように工数を推定するか、Ghost% が何を意味するか、そしてそれを責任を持って使う方法。

開発者を監視しているのですか？時間はどこから来るのですか？+

いいえ——時間追跡も、画面の監視も、キーストロークの記録もありません。私たちが分析するのはコード変更そのものだけで、その認知的な難度を基準開発者の時間で推定します。タイムシートではなく、ものさしです。

「時間での推定」とは何を意味するのですか？+

コードベースを把握し AI を使わない中級開発者（経験 3〜4 年）が、その変更にどれくらいの時間を要するかということです。これは作業の難度を測るものであり——行数でも、机に向かった実際の時間でもありません。コードを書く、手作業でテストする、レビューで修正する時間を含み、会議・計画・レビュー待ちは除外します。

工数は具体的にどのように推定するのですか？+

「ニューラルネットワークへの 1 回の呼び出し」ではなく、AI が 1 つの層にすぎない複数段階のパイプラインです。まずモデルがコード変更そのもの——実際に何が変わったか——を読み、行数やコミット数を数えるのではなく、基準開発者にとっての認知的な難度を判断します。その上に決定論的なアルゴリズム層が動作します：システムは各変更の性質を分類し、難度の高い作業（例：インフラ、データ移行、セキュリティ）を個別に認識し、機械的・生成された変更（大量の検索置換、生成・移動されたコード、フォーマット整形）を除外し、一連の補正ルールとガードレールを適用して、単一のモデルの推測が結果を左右しないようにします。大きな、または複合的なコミットはより細かく扱われます。同じ基準が全員に自動的に適用され、各コミットは一度だけ評価されて結果が固定されます——だからこそ比較可能で再現可能なのです。

この算出方法はどのような経験とデータに基づいているのですか？+

実際のエンタープライズ開発から生まれました：アルゴリズム層は、実プロジェクトで集めた経験的なパターン——見た目より高くつくことが多い変更と、規模のわりに安価な変更——をエンコードしています。これらのルールは実際の基準推定値と照合されます（較正）。そのため、システムは単純な行数カウンターというより、作業を評価する経験豊富なテクニカルリードのように振る舞います。

私のチームは AI を使っています。それで指標は崩れませんか？+

むしろ逆で——それこそが本質です。私たちはあなたのチームを、AI を使わずに作業する基準開発者と比較します。AI によって 1 日により多くを提供できれば Ghost% は上がり、その「AI 普及前の基準」との差こそ、まさに製品が示すものです。歪みではなく——結果なのです。

Ghost% とは何で、どう読めばよいのですか？+

あなたの日次成果と基準開発者の成果との比率です。100% は基準と同等、それより高ければ 1 日により多くを提供しており、低ければより少ないことを意味します。労働時間でも残業でもありません：高い数値は「燃え尽きている」ことを意味せず、低い数値だけで「能力が低い」ことを意味するわけでもありません。

どこまで信頼できますか？+

これは測定ではなくモデルです。実際の時間を誰も再構築できないため、価値は全員に同じ 1 つのルールを適用する点にあります：傾向や比較には強く、特定の個人について時間単位の正確さを出すためのものではありません。判定を下すためではなく、より良い問いを立てるためのツールです。

コミットを分割したり結合したりして、この指標を操作できますか？+

コミットの分割・結合では意味のある変化は起きません——評価されるのは変更の実質と難度であり、コミットや行の数ではありません。さらに重要なのは：人が直接ターゲットにされる指標は、いずれ仕事の代わりに指標そのものが最適化されてしまうということです。だからこそ、個人の KPI ではなくチームのシグナルや傾向として使ってください——そうすれば操作する余地はありません。

ある人の数値が自分の印象と合いません。なぜですか？+

システムが見ているのはコードであって、役割の全体ではありません：設計、レビュー、メンタリング、計画、会議は推定に含まれません。食い違いは多くの場合、その人の価値の多くがコミットの外にあることを意味します——それ自体が気づくに値することです。

コードだけに専念していない人を、システムは考慮しますか？+

システム単独では考慮しません：見えるのはコードだけで、その人の実際の役割や業務量（レビュー、メンタリング、会議、サポート）は分かりません。全体の業務量を知っているのはマネージャーだけです。そのための「Share（割合）」パラメーターがあります——従業員が実際にコードを書くことに費やす時間の割合（0〜100%）です。既定は 100%（その人がコードに専念していると仮定）で、マネージャーがコード以外の作業を反映して手動で下げます——ここで、コードには含まれない文脈がシステムに入ります。すると、終日コードを書いているわけではない人にとっても、基準との比較が公平になります。

評価、報酬、解雇に使えますか？+

システム単独では使えません。これは会話を始めるためのチームのシグナルであり傾向であって、個人への判定ではありません：1 つの指標で品質・影響・文脈を捉えることはできません。

金額での「コスト」と「価値」は何を意味するのですか？+

コストは、提供された作業を標準的な単価で換算したおおよその金額です。価値は、その量を AI なしで手作業で再現する場合のおおよその金額です。両者の差は、レバレッジ（ツール／AI）のおおよその指標であり、損益計算書ではありません。