Hoe DevGhost inspanning schat

Laatst bijgewerkt 6 juni 2026

DevGhost schat de cognitieve inspanning achter codewijzigingen — hoe moeilijk het werk was, niet hoeveel regels veranderden of hoe lang iemand achter een toetsenbord zat. De schatting wordt uitgedrukt in de uren die een mid-level ontwikkelaar (3–4 jaar) die de codebase kent en zonder AI werkt, nodig zou hebben: de code schrijven, deze handmatig testen en hem in review oplossen. Het sluit bewust vergaderingen, planning en wachten op review uit.

Een pipeline, geen enkele AI-call

Inspanning is niet de uitkomst van één modelcall. Eerst leest een taalmodel de daadwerkelijke wijziging — wat is toegevoegd, verwijderd en geherstructureerd — en beoordeelt de moeilijkheid voor de referentie-ontwikkelaar, in plaats van regels of commits te tellen. Daarbovenop draait een deterministische, op regels gebaseerde laag die voorkomt dat één modelgok het resultaat doet uitslaan.

De deterministische laag

De regellaag doet het werk dat een zorgvuldige reviewer zou doen:

Classificeert de aard van elke wijziging en herkent werk met hoge inzet — infrastructuur, datamigraties, beveiliging — afzonderlijk.
Filtert mechanische en gegenereerde wijzigingen eruit: massaal zoeken-en-vervangen, gegenereerde of verplaatste code en opmaak.
Past sets correctieregels en waarborgen toe, zodat één modelgok het resultaat niet kan doen uitslaan.
Splitst grote en gecombineerde commits gedetailleerder op in plaats van ze als één geheel te scoren.

Inspanning over tijd spreiden

De inspanning van één commit wordt over maximaal vijf werkdagen gespreid en begrensd op vijf productieve uren per dag, zodat één grote merge het beeld van een enkele dag niet vertekent — en de dagcijfers die Ghost% voeden, realistisch blijven.

Consistentie en kalibratie

Dezelfde standaard wordt automatisch op iedereen toegepast. Elke commit wordt eenmaal beoordeeld en het resultaat ligt vast, wat de cijfers vergelijkbaar en reproduceerbaar maakt.

De algoritmische laag codeert empirische patronen uit echte enterprise-ontwikkeling — welke wijzigingen meer kosten dan ze lijken, en welke goedkoop zijn ondanks hun omvang — en die regels worden getoetst aan referentieschattingen. Het systeem gedraagt zich minder als een regelteller en meer als een ervaren tech lead die het werk beoordeelt.

Van inspanning naar Ghost%

De dagelijkse inspanning wordt vervolgens vergeleken met de Ghost-norm — drie productieve uren per werkdag — om Ghost% te produceren, de output van het team ten opzichte van een pre-AI-basislijn. De schattingen zijn probabilistisch en vormen geen meting van een individu.

Wat is Ghost%? →