DevGhost ประเมินความพยายามอย่างไร

อัปเดตล่าสุด 6 มิถุนายน 2569

DevGhost ประเมินความพยายามทางความคิดเบื้องหลังการเปลี่ยนแปลงโค้ด — ว่างานยากแค่ไหน ไม่ใช่ว่าเปลี่ยนกี่บรรทัดหรือนั่งหน้าคีย์บอร์ดนานแค่ไหน การประมาณการแสดงเป็นชั่วโมงที่นักพัฒนาระดับกลาง (3–4 ปี) ผู้รู้จัก codebase และทำงานโดยไม่ใช้ AI จะต้องใช้: ในการเขียนโค้ด ทดสอบด้วยมือ และแก้ไขในขั้นตอนรีวิว โดยจงใจไม่รวมการประชุม การวางแผน และการรอรีวิว

ไปป์ไลน์ ไม่ใช่การเรียก AI ครั้งเดียว

ความพยายามไม่ใช่ผลลัพธ์จากการเรียกโมเดลเพียงครั้งเดียว ขั้นแรก language model จะอ่านการเปลี่ยนแปลงจริง — สิ่งที่ถูกเพิ่ม ลบ และปรับโครงสร้าง — และตัดสินความยากของมันสำหรับนักพัฒนาอ้างอิง แทนการนับบรรทัดหรือ commit นอกเหนือจากนั้น ยังมีชั้นที่กำหนดผลแน่นอนตามกฎทำงานอยู่ ซึ่งป้องกันไม่ให้การคาดเดาของโมเดลเดียวเหวี่ยงผลลัพธ์

ชั้นที่กำหนดผลแน่นอน

ชั้นกฎทำงานเหมือนที่ผู้รีวิวที่รอบคอบจะทำ:

จัดประเภทลักษณะของการเปลี่ยนแปลงแต่ละรายการ และรับรู้งานที่มีความเสี่ยงสูง — โครงสร้างพื้นฐาน การย้ายข้อมูล ความปลอดภัย — แยกออกมา
กรองการเปลี่ยนแปลงเชิงกลและที่สร้างโดยอัตโนมัติออก: การค้นหาและแทนที่จำนวนมาก โค้ดที่สร้างหรือย้าย และการจัดรูปแบบ
ใช้ชุดกฎการแก้ไขและกลไกป้องกัน เพื่อไม่ให้การคาดเดาของโมเดลเดียวเหวี่ยงผลลัพธ์
แยกย่อย commit ขนาดใหญ่และที่รวมกันอย่างละเอียดมากขึ้น แทนการให้คะแนนเป็นก้อนเดียว

การกระจายความพยายามตามเวลา

ความพยายามของ commit เดียวจะถูกกระจายไปได้สูงสุดห้าวันทำงานและจำกัดที่ห้าชั่วโมงที่มีประสิทธิภาพต่อวัน ดังนั้น merge ขนาดใหญ่ครั้งเดียวจึงไม่บิดเบือนภาพของวันใดวันหนึ่ง — และตัวเลขรายวันที่ป้อนเข้าสู่ Ghost% ยังคงสมจริง

ความสม่ำเสมอและการปรับเทียบ

มาตรฐานเดียวกันถูกใช้กับทุกคนโดยอัตโนมัติ แต่ละ commit ถูกประเมินครั้งเดียวและผลลัพธ์ถูกตรึงไว้ ซึ่งทำให้ตัวเลขเปรียบเทียบได้และทำซ้ำได้

ชั้นอัลกอริทึมเข้ารหัสรูปแบบเชิงประจักษ์จากการพัฒนาในองค์กรจริง — ว่าการเปลี่ยนแปลงใดมีต้นทุนมากกว่าที่เห็น และอันใดราคาถูกแม้มีขนาดใหญ่ — และกฎเหล่านั้นถูกตรวจสอบเทียบกับการประมาณการอ้างอิง ระบบจึงทำงานน้อยลงเหมือนเครื่องนับบรรทัด และมากขึ้นเหมือน tech lead ที่มีประสบการณ์ประเมินงาน

จากความพยายามสู่ Ghost%

จากนั้นความพยายามรายวันจะถูกเปรียบเทียบกับเกณฑ์ Ghost — สามชั่วโมงที่มีประสิทธิภาพต่อวันทำงาน — เพื่อสร้าง Ghost% ซึ่งคือผลงานของทีมเทียบกับเกณฑ์พื้นฐานก่อนยุค AI การประมาณการเป็นเชิงความน่าจะเป็นและไม่ใช่การวัดบุคคลใดบุคคลหนึ่ง

Ghost% คืออะไร? →