πŸ—‚οΈ AI 기반 μ†Œν”„νŠΈμ›¨μ–΄μ˜ ν’ˆμ§ˆμ€ μž‘μ—… λ‹¨μœ„(unit of work) 관리에 λ‹¬λ €μžˆλ‹€

AI 기반 μ†Œν”„νŠΈμ›¨μ–΄ κ°œλ°œμ΄λΌλŠ” κΈ°μˆ μ€ 본질적으둜 μž‘μ—… λ‹¨μœ„λ₯Ό μ˜¬λ°”λ₯΄κ²Œ κ΄€λ¦¬ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

μ œκ°€ AI 기반 μ½”λ”©μ΄λΌλŠ” μƒˆλ‘œμš΄ κΈ°μˆ μ— μ΅μˆ™ν•˜μ§€ μ•Šμ•˜μ„ λ•Œ, λͺ¨λΈ μžμ²΄λŠ” μƒλ‹Ήνžˆ μ§€λŠ₯μ μ΄μ—ˆμŒμ—λ„ λΆˆκ΅¬ν•˜κ³  ν˜•νŽΈμ—†λŠ” 결과물을 μ–»κ³€ ν–ˆμŠ΅λ‹ˆλ‹€. μ•Œκ³  λ³΄λ‹ˆ κ°€μž₯ 큰 병λͺ© ν˜„μƒμ€ μ§€λŠ₯이 μ•„λ‹ˆλΌ, μ˜¬λ°”λ₯Έ μ»¨ν…μŠ€νŠΈλ₯Ό μ œκ³΅ν•˜λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€.

Andrej KarpathyλŠ” 이 μ£Όμ œμ— λŒ€ν•œ 제 이전 글을 μ–ΈκΈ‰ν•˜λ©°, AI 기반 μ—”μ§€λ‹ˆμ–΄λ§ μž‘μ—…μ„ "AIλ₯Ό 짧은 λͺ©μ€„에 λ¬Άμ–΄λ‘λŠ” 것"이라고 ν‘œν˜„ν–ˆμŠ΅λ‹ˆλ‹€. AI μ—μ΄μ „νŠΈκ°€ κ·Έ μ–΄λŠ λ•Œλ³΄λ‹€ λ…λ¦½μ μœΌλ‘œ μ½”λ“œμ— κ΄€μ—¬ν•˜λŠ” ν”„λ‘œμ„ΈμŠ€μ—μ„œ '짧은 λͺ©μ€„'은 μ–΄λ–€ λͺ¨μŠ΅μΌκΉŒμš”? κ·ΈλŠ” 힌트λ₯Ό λ‚¨κ²ΌμŠ΅λ‹ˆλ‹€. "ν•˜λ‚˜μ˜ ꡬ체적인 μž‘μ—…μ— λŒ€ν•΄ μž‘μ€ λ‹¨μœ„λ‘œ μž‘μ—…ν•˜λΌ"λŠ” κ²ƒμž…λ‹ˆλ‹€.

μ μ ˆν•œ 크기의 μž‘μ—… λ‹¨μœ„λŠ” μ»¨ν…μŠ€νŠΈλ₯Ό μ‘΄μ€‘ν•©λ‹ˆλ‹€

μ €λŠ” 'μ»¨ν…μŠ€νŠΈ μ—”μ§€λ‹ˆμ–΄λ§'μ΄λΌλŠ” μš©μ–΄λ₯Ό μ’‹μ•„ν•©λ‹ˆλ‹€. 이 μš©μ–΄λŠ” μ™œ μž‘μ—… λ‹¨μœ„ 관리가 AI λ„κ΅¬λ‘œλΆ€ν„° 더 λ‚˜μ€ κ²°κ³Όλ₯Ό μ–»κΈ° μœ„ν•œ κ°€μž₯ μ€‘μš”ν•œ κΈ°μˆ μΈμ§€λ₯Ό 더 잘 μ„€λͺ…ν•  수 μžˆλŠ” μ–΄νœ˜μ˜ 폭을 λ„“ν˜€μ£Όμ—ˆκΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. μ΄λŠ” AIκ°€ μ½”λ“œλ₯Ό μƒμ„±ν•˜λŠ” 'μΊ”λ²„μŠ€'λ₯Ό μ€‘μ‹¬μœΌλ‘œ λ…Όμ˜λ₯Ό μ΄λŒμ–΄ κ°‘λ‹ˆλ‹€.

μ €λŠ” Anthropic의 λ¬Έμ„œμ— μžˆλŠ” μ‹œκ° 자료λ₯Ό μ’‹μ•„ν•©λ‹ˆλ‹€.

LLM이 μƒμ„±ν•˜λŠ” 결과물은 λ‹€μŒ 토큰 ν™•λ₯ μ˜ μƒ˜ν”Œμž…λ‹ˆλ‹€. 토큰을 생성할 λ•Œλ§ˆλ‹€ 이전 λ°˜λ³΅μ—μ„œ 이미 μƒμ„±λœ λ‚΄μš©μ΄ μ»¨ν…μŠ€νŠΈ 창에 μΆ”κ°€λ©λ‹ˆλ‹€. 이 μ»¨ν…μŠ€νŠΈ 창이 μ–΄λ–€ λͺ¨μŠ΅μΈμ§€κ°€ μƒμ„±λœ 결과물의 ν’ˆμ§ˆμ— λ§‰λŒ€ν•œ 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€.

Drew BreunigλŠ” μ»¨ν…μŠ€νŠΈμ— λ°œμƒν•  수 μžˆλŠ” μ˜¨κ°– 문제점과 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ λ‹€μ–‘ν•œ κΈ°μˆ μ— λŒ€ν•΄ ν›Œλ₯­ν•œ 글을 μΌμŠ΅λ‹ˆλ‹€.

졜고의 AI 기반 개발 μž₯인듀은 AIκ°€ ν•œ λ²ˆμ—(one-shot) μ†”λ£¨μ…˜μ„ 내놓도둝 ν•˜κΈ° μœ„ν•΄ μ»¨ν…μŠ€νŠΈμ˜ 섀계와 배열에 λŒ€ν•΄ 자주 κ³ λ―Όν•©λ‹ˆλ‹€. μ΄λŠ” AI 코딩에 λŒ€ν•œ κ³Όμž₯된 κ΄‘κ³ μ™€λŠ” 달리, κΉŒλ‹€λ‘­κ³  λ…Έλ ₯이 ν•„μš”ν•œ μΌμž…λ‹ˆλ‹€.

λ§Œμ•½ 쒋은 결과물을 λ§Œλ“œλŠ” 데 ν•„μš”ν•œ 정보λ₯Ό μ»¨ν…μŠ€νŠΈμ— μ œκ³΅ν•˜μ§€ μ•ŠμœΌλ©΄, AIλŠ” ν™˜κ°(hallucination)을 μΌμœΌν‚€κ±°λ‚˜ μ—¬λŸ¬λΆ„μ˜ μ½”λ“œλ² μ΄μŠ€ κ΄€ν–‰κ³Ό μΌμΉ˜ν•˜μ§€ μ•ŠλŠ” μ½”λ“œλ₯Ό 생성할 κ²ƒμž…λ‹ˆλ‹€. 특히 μ†Œν”„νŠΈμ›¨μ–΄ μ‹œμŠ€ν…œμ˜ 톡합 지점(integration points)μ—μ„œ 맀우 μ·¨μ•½ν•©λ‹ˆλ‹€.

λ°˜λ©΄μ—, μ»¨ν…μŠ€νŠΈλ₯Ό λ„ˆλ¬΄ λ§Žμ€ μ •λ³΄λ‘œ μ±„μš°λ©΄ 집쀑λ ₯이 λ–¨μ–΄μ Έ 결과물의 ν’ˆμ§ˆμ΄ μ €ν•˜λ©λ‹ˆλ‹€.

μž‘μ—…μ„ 'μ μ ˆν•œ 크기(right-sized)'의 μž‘μ—… λ‹¨μœ„λ‘œ λ‚˜λˆ„λŠ” 것, 즉 λ”± μ λ‹Ήν•œ μ–‘μ˜ μ„ΈλΆ€ 사항을 μ„€λͺ…ν•˜λŠ” 것이 μ»¨ν…μŠ€νŠΈ 창을 κ°œμ„ ν•˜κ³ , 결과적으둜 μƒμ„±λœ μ½”λ“œμ˜ μ •ν™•μ„±κ³Ό ν’ˆμ§ˆμ„ λ†’μ΄λŠ” κ°€μž₯ κ°•λ ₯ν•œ μˆ˜λ‹¨μΌ κ²ƒμž…λ‹ˆλ‹€.

μ μ ˆν•œ 크기의 μž‘μ—… λ‹¨μœ„λŠ” 였λ₯˜ μ „νŒŒλ₯Ό μ œμ–΄ν•©λ‹ˆλ‹€

κ°„λ‹¨ν•œ 냅킨 계산(napkin maths)을 ν•΄λ³Ό μ‹œκ°„μž…λ‹ˆλ‹€.

AI μ—μ΄μ „νŠΈκ°€ 5%의 ν™•λ₯ λ‘œ μ‹€μˆ˜λ₯Ό ν•œλ‹€κ³  κ°€μ •ν•΄ λ΄…μ‹œλ‹€. μ—¬κΈ°μ„œ λ§ν•˜λŠ” μ‹€μˆ˜λŠ” λ‹¨μˆœνžˆ ν™˜κ° ν˜„μƒλ§Œμ„ μ˜λ―Έν•˜λŠ” 것이 μ•„λ‹™λ‹ˆλ‹€. λ¬Έμ„œλ₯Ό μ°Ύμ•„λ³΄λŠ” 것을 μžŠμ—ˆκ±°λ‚˜ λͺ…μ„Έμ„œμ˜ μ„ΈλΆ€ 사항을 λ†“μ³μ„œ λ°œμƒν•˜λŠ” λ―Έλ¬˜ν•œ μ‹€μˆ˜μΌ μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€.

λͺ¨λ“  μ½”λ”© μ›Œν¬ν”Œλ‘œμš°κ°€ μˆ˜λ ΄ν•˜κ³  μžˆλŠ” μ—μ΄μ „νŠΈ 기반 닀쀑 ν„΄(agentic multi-turn) μ›Œν¬ν”Œλ‘œμš°μ—μ„œλŠ” 이 였λ₯˜κ°€ 볡리처럼 μŒ“μž…λ‹ˆλ‹€. λ§Œμ•½ μ–΄λ–€ μž‘μ—…μ„ κ΅¬ν˜„ν•˜λŠ” 데 10턴이 κ±Έλ¦°λ‹€λ©΄, 성곡 ν™•λ₯ μ€ (1 – 0.95)^10 = 59.9%에 λΆˆκ³Όν•©λ‹ˆλ‹€. κ·Έλ‹€μ§€ λ†’μ§€ μ•Šμ£ .

Utkarsh Kanwat도 그의 λΈ”λ‘œκ·Έ κΈ€μ—μ„œ 같은 μ£Όμž₯을 ν–ˆμŠ΅λ‹ˆλ‹€. 그의 결둠은 μ–΄λ–€ AI μ—μ΄μ „νŠΈλΌλ„ μž₯기적인 μž‘μ—…μ„ μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄μ„œλŠ” 각 λ‹¨κ³„λ§ˆλ‹€ μž μ‹œ λ©ˆμΆ°μ„œ κ²€μ¦ν•˜λŠ”(pause-and-verify) κ²Œμ΄νŒ… λ©”μ»€λ‹ˆμ¦˜μ΄ ν•„μš”ν•˜λ‹€λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€.

Per-action
error rate
Overall Success Rate
5 turns10 turns20 turns50 turns
0.1%99.5%99.0%98.0%95.1%
1%95.1%90.4%81.8%60.5%
5%77.4%59.9%35.8%7.7%
10%59.0%34.9%12.2%0.5%
20%32.8%10.7%1.2%0.0%

κ·Έλ ‡λ‹€λ©΄ 닀쀑 ν„΄ 였λ₯˜μœ¨μ— λŒ€ν•œ μ΅œμ‹  기술 μˆ˜μ€€μ€ μ–΄λ–¨κΉŒμš”? METR은 졜근 AI λͺ¨λΈμ΄ μž₯기적인 μž‘μ—…μ—μ„œ μ–Όλ§ˆλ‚˜ λ°œμ „ν•˜κ³  μžˆλŠ”μ§€λ₯Ό λ³΄μ—¬μ£ΌλŠ” 유λͺ…ν•œ 차트λ₯Ό λ°œν‘œν–ˆμŠ΅λ‹ˆλ‹€. ν˜„μž¬ GPT-5κ°€ λ¦¬λ”λ³΄λ“œ μ΅œμƒμœ„μ— 있으며, μ•½ 2μ‹œκ°„ 길이의 μž‘μ—…μ„ 70% μ •λ„μ˜ 성곡λ₯ λ‘œ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό 역산해보면 (2μ‹œκ°„μ§œλ¦¬ μž‘μ—…μ„ 50ν„΄ 이상이라고 κ°€μ •) μ•‘μ…˜λ‹Ή 였λ₯˜μœ¨μ΄ 1% λ―Έλ§Œμ΄λΌλŠ” 계산이 λ‚˜μ˜΅λ‹ˆλ‹€.

μ•‘μ…˜λ‹Ή 1% 미만의 였λ₯˜μœ¨μ΄ μ’€ μ˜μ‹¬μŠ€λŸ½μ§€ μ•Šλ‚˜μš”? μ—μ΄μ „νŠΈ 기반 μ½”λ”© 도ꡬ(μ œκ°€ ν˜„μž¬ μ‚¬μš©ν•˜λŠ” 것은 Codex CLIμž…λ‹ˆλ‹€)λ₯Ό 자주 μ‚¬μš©ν•˜λŠ” μ‚¬λžŒμœΌλ‘œμ„œ, λ§Œμ•½ GPT-5κ°€ 제 μž‘μ—…μ„ 99.9%의 ν™•λ₯ λ‘œ μ™„λ²½ν•˜κ²Œ μ²˜λ¦¬ν•˜κΈ° μ‹œμž‘ν•œλ‹€λ©΄ 제 μ‹ λ°œμ΄λΌλ„ λ¨Ήκ² μŠ΅λ‹ˆλ‹€.

제 κ²½ν—˜μ—μ„œ λΉ„λ‘―λœ 직관에 λ”°λ₯΄λ©΄, ν˜„μž¬ 졜고의 AI쑰차도 95%의 정확도λ₯Ό 보μž₯ν•˜μ§€ λͺ»ν•©λ‹ˆλ‹€. κ·Έλ ‡λ‹€λ©΄ 이 μ°¨μ΄λŠ” μ–΄λ””μ„œ μ˜€λŠ” κ±ΈκΉŒμš”? μ‹€μ œ 논문을 μžμ„Ένžˆ λ“€μ—¬λ‹€λ³Ό ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.

우리 κ³Όμ œλŠ” 일반적으둜 μ—μ΄μ „νŠΈμ— μ˜ν•΄ 직접적인 영ν–₯을 λ°›μ§€ μ•ŠλŠ” ν•œ 크게 λ³€ν•˜μ§€ μ•ŠλŠ” ν™˜κ²½μ„ μ‚¬μš©ν•©λ‹ˆλ‹€. 반면, μ‹€μ œ κ³Όμ œλŠ” μ’…μ’… λ³€ν™”ν•˜λŠ” ν™˜κ²½μ˜ λ§₯λ½μ—μ„œ λ°œμƒν•©λ‹ˆλ‹€.

[…]

λ§ˆμ°¬κ°€μ§€λ‘œ, 단 ν•œ 번의 μ‹€μˆ˜μ— λŒ€ν•΄ 큰 νŽ˜λ„ν‹°λ₯Ό μ£ΌλŠ” κ³Όμ œλŠ” 거의 μ—†μŠ΅λ‹ˆλ‹€. μ΄λŠ” λΆ€λΆ„μ μœΌλ‘œ 인간 κΈ°μ€€μ„  μˆ˜μ§‘μ— λ“œλŠ” μ˜ˆμƒ λΉ„μš©μ„ 쀄이기 μœ„ν•¨μž…λ‹ˆλ‹€.

이것은 μ œκ°€ μˆ˜ν–‰ν•˜λŠ” μž‘μ—…λ“€κ³ΌλŠ” μ „ν˜€ λ‹€λ¦…λ‹ˆλ‹€.

METR은 ν˜„μ‹€ μ„Έκ³„μ˜ λ³΅μž‘ν•¨μ„ μΈμ •ν•©λ‹ˆλ‹€. 그듀은 μžμ‹ λ“€μ˜ κ³Όμ œμ— λŒ€ν•΄ 'λ³΅μž‘λ„ λ“±κΈ‰(messiness rating)'을 λ§Œλ“€μ—ˆκ³ , κ³Όμ œλ“€μ˜ '평균 λ³΅μž‘λ„'λŠ” 16점 λ§Œμ μ— 3.2μ μž…λ‹ˆλ‹€.

METR의 μ •μ˜μ— λ”°λ₯΄λ©΄, μ œκ°€ 주둜 μ ‘ν•˜λŠ” μ’…λ₯˜μ˜ μ†Œν”„νŠΈμ›¨μ–΄ μ—”μ§€λ‹ˆμ–΄λ§ μž‘μ—…μ€ μ΅œμ†Œ 7-8점 μ •λ„μ˜ 점수λ₯Ό 받을 κ²ƒμž…λ‹ˆλ‹€. μ†Œν”„νŠΈμ›¨μ–΄ μ—”μ§€λ‹ˆμ–΄λ§ ν”„λ‘œμ νŠΈλŠ” 경둜 의쑴적이고, 동적이며, λͺ…ν™•ν•œ λ°˜μ‚¬μ‹€μ  상황이 μ—†κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. μ €λŠ” λ³΅μž‘λ„ 13/16 μˆ˜μ€€μ— λ‹¬ν•˜λŠ” λ¬Έμ œλ“€μ„ 닀뀄본 적도 μžˆμŠ΅λ‹ˆλ‹€.

과제 λ³΅μž‘λ„κ°€ 1점 μ¦κ°€ν•˜λ©΄ 평균 성곡λ₯ μ΄ μ•½ 8.1% κ°μ†Œν•©λ‹ˆλ‹€.

METR이 μΈ‘μ •ν•œ λ³΅μž‘λ„μ˜ 영ν–₯을 λ°”νƒ•μœΌλ‘œ 좔정해보면, GPT-5λŠ” 2μ‹œκ°„μ§œλ¦¬ μž‘μ—…μ— λŒ€ν•œ 성곡λ₯ μ΄ 70%μ—μ„œ μ•½ 40%둜 λ–¨μ–΄μ§ˆ κ²ƒμž…λ‹ˆλ‹€. 이것이 μ œκ°€ κ²½ν—˜ν•œ ν˜„μ‹€κ³Ό 더 λΆ€ν•©ν•©λ‹ˆλ‹€.

μ €λŠ” μˆœμˆ˜ν•œ μ§€λŠ₯만으둜 이 λ³΅μž‘μ„±μ„ ν•΄κ²°ν•  수 μžˆμ„μ§€ ν™•μ‹ ν•  수 μ—†μŠ΅λ‹ˆλ‹€. ν™˜κ²½μ˜ ν˜Όλž€κ³Ό ν˜„μ‹€μ˜ λͺ¨ν˜Έν•¨μ— λŒ€ν•œ 강건함은 근본적으둜 μ»¨ν…μŠ€νŠΈλ₯Ό 잘 κ΄€λ¦¬ν•˜λŠ” 것에 달렀 μžˆμŠ΅λ‹ˆλ‹€. 이 문제λ₯Ό ν•΄κ²°ν•  λ§ˆλ²• 같은 비법을 μ°ΎκΈ° μ „κΉŒμ§€λŠ”, 였λ₯˜μ˜ 볡리 효과λ₯Ό κ΄€λ¦¬ν•˜κΈ° μœ„ν•΄ 문제λ₯Ό μž‘μ—… λ‹¨μœ„λ‘œ λ‚˜λˆ„κ³  검증 κ°€λŠ₯ν•œ 체크포인트λ₯Ό λ‘λŠ” μ›Œν¬ν”Œλ‘œμš°κ°€ ν•„μš”ν•˜λ‹€λŠ” 것이 λΆ„λͺ…ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ 검증 κ°€λŠ₯ν•œ μ²΄ν¬ν¬μΈνŠΈλŠ” 인간이 이해할 수 μžˆμ–΄μ•Ό(legible) ν•©λ‹ˆλ‹€.

κ·Έλ ‡λ‹€λ©΄, 'μ μ ˆν•œ 크기'의 μž‘μ—… λ‹¨μœ„λž€ λ¬΄μ—‡μΌκΉŒμš”?

μ μ ˆν•œ 크기의 μž‘μ—… λ‹¨μœ„λŠ” μž‘μ•„μ•Ό ν•˜κ³ , μ›ν•˜λŠ” κ²°κ³Όλ₯Ό κ°„κ²°ν•˜κ²Œ μ„€λͺ…ν•΄μ•Ό ν•©λ‹ˆλ‹€.

μž‘μ—… λ‹¨μœ„κ°€ μ™„λ£Œλ˜μ—ˆμ„ λ•Œμ˜ μ›ν•˜λŠ” κ²°κ³ΌλŠ” 인간이 이해할 수 μžˆμ–΄μ•Ό(human-legible) ν•©λ‹ˆλ‹€. μ €λŠ” 그것이 이해 κ°€λŠ₯ν•œ λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜λ₯Ό μ œκ³΅ν•΄μ•Ό ν•œλ‹€κ³  μ£Όμž₯ν•©λ‹ˆλ‹€. ꢁ극적으둜 μ†Œν”„νŠΈμ›¨μ–΄μ˜ μ‚¬μš©μžλŠ” 인간(λ˜λŠ” μΈκ°„μ˜ κ°œλ…μ„ λͺ¨λΈλ§ν•œ μ‹œμŠ€ν…œ)이 될 것이기 λ•Œλ¬Έμž…λ‹ˆλ‹€. λ”°λΌμ„œ ν”„λ‘œμ νŠΈλ₯Ό λΆ„ν•΄ν•˜λŠ” μš°μ•„ν•œ 방법은 각 μ²΄ν¬ν¬μΈνŠΈμ—μ„œ 이해 κ°€λŠ₯ν•œ λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜λ₯Ό μ œκ³΅ν•˜λŠ” μž‘μ€ μž‘μ—… λ‹¨μœ„λ‘œ λͺ¨λΈλ§ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. μ΄λŠ” LLM의 μ»¨ν…μŠ€νŠΈ 창을 μ‘΄μ€‘ν•˜κ³  였λ₯˜ μ „νŒŒλ₯Ό κ΄€λ¦¬ν•˜λŠ” 데 도움이 될 κ²ƒμž…λ‹ˆλ‹€.

μ†Œν”„νŠΈμ›¨μ–΄ μ—”μ§€λ‹ˆμ–΄λ“€μ€ 이미 λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜λ₯Ό μ œκ³΅ν•˜κ³  λͺ¨λ“  μ»¨ν…μŠ€νŠΈμ™€ λ²”μœ„ ν˜‘μƒμ˜ 기쀀점 역할을 ν•˜λŠ” μž‘μ—… λ‹¨μœ„μΈ User Storiesλ₯Ό μ •μ˜ν–ˆμŠ΅λ‹ˆλ‹€. μ €λŠ” 이것이 큰 문제λ₯Ό LLM이 ν•œ λ²ˆμ— ν•΄κ²°ν•  수 μžˆλŠ” μž‘μ€ λ¬Έμ œλ“€λ‘œ λ‚˜λˆ„λŠ” 데 쒋은 좜발점이라고 μƒκ°ν•©λ‹ˆλ‹€. User StoriesλŠ” 'μž‘μ—…'κ³Ό 달리 μ†Œν”„νŠΈμ›¨μ–΄ 개발의 λ³΅μž‘ν•˜κ³  동적인 ν™˜κ²½μ—μ„œλ„ κ²¬κ³ ν•œ μ‚¬μš©μž 결과물에 μ§‘μ€‘ν•©λ‹ˆλ‹€. SrihariλŠ” μ†Œν”„νŠΈμ›¨μ–΄ 개발 ν”„λ‘œμ„ΈμŠ€μ—μ„œ User Stories의 κ°€μΉ˜μ— λŒ€ν•΄ μš°μ•„ν•˜κ²Œ 글을 썼으며, λ³΅μž‘ν•œ μ†Œν”„νŠΈμ›¨μ–΄ ꡬ좕 μž‘μ—…μ— μ ν•©ν•œ 속성을 더 잘 μ΄ν•΄ν•˜κΈ° μœ„ν•΄ 그의 글을 μ½μ–΄λ³΄μ‹œκΈΈ μΆ”μ²œν•©λ‹ˆλ‹€.

제곡 κ°€λŠ₯ν•œ λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜λŠ” λͺ¨λ“  μ΄ν•΄κ΄€κ³„μžκ°€ μ΄ν•΄ν•˜κ³  ν˜‘λ ₯ν•  수 μžˆλŠ” 것이기도 ν•©λ‹ˆλ‹€. μ†Œν”„νŠΈμ›¨μ–΄λŠ” 개발자 혼자 진곡 μƒνƒœμ—μ„œ λ§Œλ“œλŠ” 것이 μ•„λ‹™λ‹ˆλ‹€. νŒ€, μ œν’ˆ μ†Œμœ μž, λΉ„μ¦ˆλ‹ˆμŠ€ λ‹΄λ‹Ήμž, μ‚¬μš©μžμ˜ ν˜‘λ ₯이 ν•„μš”ν•©λ‹ˆλ‹€. AI μ—μ΄μ „νŠΈκ°€ λ‹€λ₯Έ μ΄ν•΄κ΄€κ³„μžλ“€κ³Ό λΆ„λ¦¬λœ 자체 μ»¨ν…μŠ€νŠΈ ν™˜κ²½μ—μ„œ μž‘λ™ν•œλ‹€λŠ” 사싀은 νš¨μœ¨μ„±κ³Ό κ·Έ 이점의 전달을 μ €ν•΄ν•©λ‹ˆλ‹€. μ €λŠ” 이것이 λ°˜λ“œμ‹œ λ©”μ›Œμ Έμ•Ό ν•  μ€‘μš”ν•œ 격차라고 μƒκ°ν•©λ‹ˆλ‹€.

μž‘μ—… λ‹¨μœ„ 크기 μ™„λ£Œ μ‹œ κ²°κ³Όλ¬Ό
TODO ν•­λͺ© μž‘μŒ 점진적인 기술적 κ°€μΉ˜
'κ³„νš λͺ¨λ“œ' 큼 기술적 κ°€μΉ˜
Amazon Kiro Spec μž‘μŒ 기술적 κ°€μΉ˜
User Story μž‘μŒ λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜

μ˜€λŠ˜λ‚  λŒ€λΆ€λΆ„μ˜ AI μ—μ΄μ „νŠΈλŠ” 잘 μž‘λ™ν•˜λŠ” 'κ³„νš(planning)' λͺ¨λ“œλ₯Ό κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. 이것은 μ—μ΄μ „νŠΈκ°€ ꢀ도λ₯Ό λ²—μ–΄λ‚˜μ§€ μ•Šλ„λ‘ ν•˜λŠ” λ°λŠ” μ’‹μ§€λ§Œ, λŒ€λΆ€λΆ„ 기술적 κ°€μΉ˜λ₯Ό μ œκ³΅ν•  뿐 λ°˜λ“œμ‹œ 이해 κ°€λŠ₯ν•œ λΉ„μ¦ˆλ‹ˆμŠ€ 결과물을 μ œκ³΅ν•˜μ§€λŠ” μ•ŠμŠ΅λ‹ˆλ‹€. μ €λŠ” κ³„νš κΈ°λŠ₯이 ν”„λ‘œμ νŠΈλ₯Ό μž‘μ€ λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜ λ‹¨μœ„λ‘œ λ‚˜λˆ„λŠ” 우리의 아이디어와 μƒν˜Έ 보완적이라고 λ―ΏμŠ΅λ‹ˆλ‹€. μ œκ°€ μ œμ•ˆν•˜λŠ” μž‘μ—… λ‹¨μœ„λŠ” 기쑴의 κ³„νš λ„κ΅¬λ‘œ κ³„νšν•  수 μžˆμŠ΅λ‹ˆλ‹€. 그리고 μ €λŠ” 이것이 μ•žμ„œ μ„€λͺ…ν•œ μ»¨ν…μŠ€νŠΈ λΆ€νŒ¨(context rot) 문제 λ•Œλ¬Έμ— 큰 μž‘μ—… λ‹¨μœ„λ₯Ό κ³„νšν•˜λŠ” 것보닀 μš°μˆ˜ν•˜λ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€.

λ¬Όλ‘ , Agile λ°©λ²•λ‘ μ—μ„œ μ„€λͺ…ν•˜λŠ” ν‰λ²”ν•œ User Storiesλ§ŒμœΌλ‘œλŠ” μΆ©λΆ„ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. μ—μ΄μ „νŠΈκ°€ μŠ€ν† λ¦¬μ˜ λΉ„μ¦ˆλ‹ˆμŠ€ κ°€μΉ˜ 결과물에 λΆ€ν•©ν•˜λŠ” μ˜¬λ°”λ₯Έ μ»¨ν…μŠ€νŠΈλ₯Ό μˆ˜μ§‘ν•˜λ„λ‘ μœ λ„ν•  수 μžˆλŠ” 'κ·Έ μ΄μƒμ˜ 무언가'κ°€ λ™λ°˜λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

The quality of AI-assisted software depends on unit of work management - nilenso blog
…

source