DevGhost가 작업량을 추정하는 방법
마지막 업데이트 2026년 6월 6일
DevGhost는 코드 변경 뒤에 숨은 인지적 작업량을 추정합니다 — 얼마나 많은 줄이 바뀌었는지나 누군가 키보드 앞에 얼마나 앉아 있었는지가 아니라, 작업이 얼마나 어려웠는지를 봅니다. 이 추정치는 코드베이스를 잘 알고 AI 없이 일하는 중급 개발자(3~4년차)가 필요로 하는 시간으로 표현됩니다: 코드를 작성하고, 직접 테스트하고, 리뷰에서 수정하는 시간입니다. 회의, 계획, 리뷰 대기 시간은 의도적으로 제외합니다.
하나의 AI 호출이 아닌 파이프라인
작업량은 단일 모델 호출의 결과가 아닙니다. 먼저 언어 모델이 실제 변경 — 무엇이 추가·삭제·재구성되었는지 — 을 읽고, 줄이나 커밋을 세는 대신 기준 개발자 기준의 난이도를 판단합니다. 그 위에서 결정론적 규칙 기반 계층이 작동하여, 어떤 단일 모델 추측도 결과를 좌우하지 못하게 합니다.
결정론적 계층
규칙 계층은 꼼꼼한 리뷰어가 할 일을 수행합니다:
- 각 변경의 성격을 분류하고, 인프라·데이터 마이그레이션·보안과 같은 중대한 작업을 별도로 인식합니다.
- 기계적이고 생성된 변경을 걸러냅니다: 대량 찾아 바꾸기, 생성되거나 이동된 코드, 서식 변경 등입니다.
- 보정 규칙과 가드레일을 적용하여 하나의 모델 추측이 결과를 좌우하지 못하게 합니다.
- 크고 결합된 커밋을 하나의 덩어리로 채점하는 대신 더 세부적으로 분해합니다.
작업량을 시간에 걸쳐 분산하기
단일 커밋의 작업량은 최대 5 작업일에 걸쳐 분산되고 하루 생산 시간 5시간으로 제한되므로, 하나의 큰 병합이 하루의 그림을 왜곡하지 않으며 — Ghost%에 반영되는 일일 수치가 현실적으로 유지됩니다.
일관성과 보정
동일한 기준이 모두에게 자동으로 적용됩니다. 각 커밋은 한 번 평가되고 그 결과가 고정되며, 이것이 수치를 비교 가능하고 재현 가능하게 만듭니다.
알고리즘 계층은 실제 엔터프라이즈 개발에서 얻은 경험적 패턴을 — 어떤 변경이 보이는 것보다 더 비싼지, 어떤 변경이 크기에 비해 저렴한지를 — 인코딩하며, 그 규칙은 기준 추정치와 대조하여 검증됩니다. 시스템은 줄을 세는 도구보다는 작업을 평가하는 노련한 테크 리드처럼 동작합니다.
작업량에서 Ghost%로
그런 다음 일일 작업량을 Ghost 기준 — 하루 생산 시간 3시간 — 과 비교하여 Ghost%, 즉 AI 이전 기준선 대비 팀의 산출량을 산출합니다. 이 추정치는 확률적이며 어떤 개인을 측정한 것이 아닙니다.

