ποΈ AI κΈ°λ° μννΈμ¨μ΄μ νμ§μ μμ λ¨μ(unit of work) κ΄λ¦¬μ λ¬λ €μλ€
AI κΈ°λ° μννΈμ¨μ΄ κ°λ°μ΄λΌλ κΈ°μ μ λ³Έμ§μ μΌλ‘ μμ λ¨μλ₯Ό μ¬λ°λ₯΄κ² κ΄λ¦¬νλ κ²μ λλ€.
μ κ° AI κΈ°λ° μ½λ©μ΄λΌλ μλ‘μ΄ κΈ°μ μ μ΅μνμ§ μμμ λ, λͺ¨λΈ μ체λ μλΉν μ§λ₯μ μ΄μμμλ λΆκ΅¬νκ³ ννΈμλ κ²°κ³Όλ¬Όμ μ»κ³€ νμ΅λλ€. μκ³ λ³΄λ κ°μ₯ ν° λ³λͺ© νμμ μ§λ₯μ΄ μλλΌ, μ¬λ°λ₯Έ 컨ν μ€νΈλ₯Ό μ 곡νλ κ²μ΄μμ΅λλ€.
Andrej Karpathyλ μ΄ μ£Όμ μ λν μ μ΄μ κΈμ μΈκΈνλ©°, AI κΈ°λ° μμ§λμ΄λ§ μμ μ "AIλ₯Ό μ§§μ λͺ©μ€μ λ¬Άμ΄λλ κ²"μ΄λΌκ³ νννμ΅λλ€. AI μμ΄μ νΈκ° κ·Έ μ΄λ λλ³΄λ€ λ 립μ μΌλ‘ μ½λμ κ΄μ¬νλ νλ‘μΈμ€μμ 'μ§§μ λͺ©μ€'μ μ΄λ€ λͺ¨μ΅μΌκΉμ? κ·Έλ ννΈλ₯Ό λ¨κ²Όμ΅λλ€. "νλμ ꡬ체μ μΈ μμ μ λν΄ μμ λ¨μλ‘ μμ νλΌ"λ κ²μ λλ€.
μ μ ν ν¬κΈ°μ μμ λ¨μλ 컨ν μ€νΈλ₯Ό μ‘΄μ€ν©λλ€
μ λ '컨ν μ€νΈ μμ§λμ΄λ§'μ΄λΌλ μ©μ΄λ₯Ό μ’μν©λλ€. μ΄ μ©μ΄λ μ μμ λ¨μ κ΄λ¦¬κ° AI λꡬλ‘λΆν° λ λμ κ²°κ³Όλ₯Ό μ»κΈ° μν κ°μ₯ μ€μν κΈ°μ μΈμ§λ₯Ό λ μ μ€λͺ ν μ μλ μ΄νμ νμ λνμ£ΌμκΈ° λλ¬Έμ λλ€. μ΄λ AIκ° μ½λλ₯Ό μμ±νλ 'μΊλ²μ€'λ₯Ό μ€μ¬μΌλ‘ λ Όμλ₯Ό μ΄λμ΄ κ°λλ€.
μ λ Anthropicμ λ¬Έμμ μλ μκ° μλ£λ₯Ό μ’μν©λλ€.

LLMμ΄ μμ±νλ κ²°κ³Όλ¬Όμ λ€μ ν ν° νλ₯ μ μνμ λλ€. ν ν°μ μμ±ν λλ§λ€ μ΄μ λ°λ³΅μμ μ΄λ―Έ μμ±λ λ΄μ©μ΄ 컨ν μ€νΈ μ°½μ μΆκ°λ©λλ€. μ΄ μ»¨ν μ€νΈ μ°½μ΄ μ΄λ€ λͺ¨μ΅μΈμ§κ° μμ±λ κ²°κ³Όλ¬Όμ νμ§μ λ§λν μν₯μ λ―ΈμΉ©λλ€.
Drew Breunigλ 컨ν μ€νΈμ λ°μν μ μλ μ¨κ° λ¬Έμ μ κ³Ό μ΄λ₯Ό ν΄κ²°νκΈ° μν λ€μν κΈ°μ μ λν΄ νλ₯ν κΈμ μΌμ΅λλ€.
μ΅κ³ μ AI κΈ°λ° κ°λ° μ₯μΈλ€μ AIκ° ν λ²μ(one-shot) μ루μ μ λ΄λλλ‘ νκΈ° μν΄ μ»¨ν μ€νΈμ μ€κ³μ λ°°μ΄μ λν΄ μμ£Ό κ³ λ―Όν©λλ€. μ΄λ AI μ½λ©μ λν κ³Όμ₯λ κ΄κ³ μλ λ¬λ¦¬, κΉλ€λ‘κ³ λ Έλ ₯μ΄ νμν μΌμ λλ€.
λ§μ½ μ’μ κ²°κ³Όλ¬Όμ λ§λλ λ° νμν μ 보λ₯Ό 컨ν μ€νΈμ μ 곡νμ§ μμΌλ©΄, AIλ νκ°(hallucination)μ μΌμΌν€κ±°λ μ¬λ¬λΆμ μ½λλ² μ΄μ€ κ΄νκ³Ό μΌμΉνμ§ μλ μ½λλ₯Ό μμ±ν κ²μ λλ€. νΉν μννΈμ¨μ΄ μμ€ν μ ν΅ν© μ§μ (integration points)μμ λ§€μ° μ·¨μ½ν©λλ€.
λ°λ©΄μ, 컨ν μ€νΈλ₯Ό λ무 λ§μ μ λ³΄λ‘ μ±μ°λ©΄ μ§μ€λ ₯μ΄ λ¨μ΄μ Έ κ²°κ³Όλ¬Όμ νμ§μ΄ μ νλ©λλ€.
μμ μ 'μ μ ν ν¬κΈ°(right-sized)'μ μμ λ¨μλ‘ λλλ κ², μ¦ λ± μ λΉν μμ μΈλΆ μ¬νμ μ€λͺ νλ κ²μ΄ 컨ν μ€νΈ μ°½μ κ°μ νκ³ , κ²°κ³Όμ μΌλ‘ μμ±λ μ½λμ μ νμ±κ³Ό νμ§μ λμ΄λ κ°μ₯ κ°λ ₯ν μλ¨μΌ κ²μ λλ€.
μ μ ν ν¬κΈ°μ μμ λ¨μλ μ€λ₯ μ νλ₯Ό μ μ΄ν©λλ€
κ°λ¨ν λ ν¨ κ³μ°(napkin maths)μ ν΄λ³Ό μκ°μ λλ€.
AI μμ΄μ νΈκ° 5%μ νλ₯ λ‘ μ€μλ₯Ό νλ€κ³ κ°μ ν΄ λ΄ μλ€. μ¬κΈ°μ λ§νλ μ€μλ λ¨μν νκ° νμλ§μ μλ―Ένλ κ²μ΄ μλλλ€. λ¬Έμλ₯Ό μ°Ύμ보λ κ²μ μμκ±°λ λͺ μΈμμ μΈλΆ μ¬νμ λμ³μ λ°μνλ λ―Έλ¬ν μ€μμΌ μλ μμ΅λλ€.
λͺ¨λ μ½λ© μν¬νλ‘μ°κ° μλ ΄νκ³ μλ μμ΄μ νΈ κΈ°λ° λ€μ€ ν΄(agentic multi-turn) μν¬νλ‘μ°μμλ μ΄ μ€λ₯κ° λ³΅λ¦¬μ²λΌ μμ λλ€. λ§μ½ μ΄λ€ μμ μ ꡬννλ λ° 10ν΄μ΄ κ±Έλ¦°λ€λ©΄, μ±κ³΅ νλ₯ μ (1 β 0.95)^10 = 59.9%μ λΆκ³Όν©λλ€. κ·Έλ€μ§ λμ§ μμ£ .
Utkarsh Kanwatλ κ·Έμ λΈλ‘κ·Έ κΈμμ κ°μ μ£Όμ₯μ νμ΅λλ€. κ·Έμ κ²°λ‘ μ μ΄λ€ AI μμ΄μ νΈλΌλ μ₯κΈ°μ μΈ μμ μ μννκΈ° μν΄μλ κ° λ¨κ³λ§λ€ μ μ λ©μΆ°μ κ²μ¦νλ(pause-and-verify) κ²μ΄ν λ©μ»€λμ¦μ΄ νμνλ€λ κ²μ΄μμ΅λλ€.
Per-action error rate | Overall Success Rate | |||
---|---|---|---|---|
5 turns | 10 turns | 20 turns | 50 turns | |
0.1% | 99.5% | 99.0% | 98.0% | 95.1% |
1% | 95.1% | 90.4% | 81.8% | 60.5% |
5% | 77.4% | 59.9% | 35.8% | 7.7% |
10% | 59.0% | 34.9% | 12.2% | 0.5% |
20% | 32.8% | 10.7% | 1.2% | 0.0% |
κ·Έλ λ€λ©΄ λ€μ€ ν΄ μ€λ₯μ¨μ λν μ΅μ κΈ°μ μμ€μ μ΄λ¨κΉμ? METRμ μ΅κ·Ό AI λͺ¨λΈμ΄ μ₯κΈ°μ μΈ μμ μμ μΌλ§λ λ°μ νκ³ μλμ§λ₯Ό 보μ¬μ£Όλ μ λͺ ν μ°¨νΈλ₯Ό λ°ννμ΅λλ€. νμ¬ GPT-5κ° λ¦¬λ보λ μ΅μμμ μμΌλ©°, μ½ 2μκ° κΈΈμ΄μ μμ μ 70% μ λμ μ±κ³΅λ₯ λ‘ μνν μ μμ΅λλ€. μ΄λ₯Ό μμ°ν΄λ³΄λ©΄ (2μκ°μ§λ¦¬ μμ μ 50ν΄ μ΄μμ΄λΌκ³ κ°μ ) μ‘μ λΉ μ€λ₯μ¨μ΄ 1% λ―Έλ§μ΄λΌλ κ³μ°μ΄ λμ΅λλ€.

μ‘μ λΉ 1% λ―Έλ§μ μ€λ₯μ¨μ΄ μ’ μμ¬μ€λ½μ§ μλμ? μμ΄μ νΈ κΈ°λ° μ½λ© λꡬ(μ κ° νμ¬ μ¬μ©νλ κ²μ Codex CLIμ λλ€)λ₯Ό μμ£Ό μ¬μ©νλ μ¬λμΌλ‘μ, λ§μ½ GPT-5κ° μ μμ μ 99.9%μ νλ₯ λ‘ μλ²½νκ² μ²λ¦¬νκΈ° μμνλ€λ©΄ μ μ λ°μ΄λΌλ λ¨Ήκ² μ΅λλ€.
μ κ²½νμμ λΉλ‘―λ μ§κ΄μ λ°λ₯΄λ©΄, νμ¬ μ΅κ³ μ AIμ‘°μ°¨λ 95%μ μ νλλ₯Ό 보μ₯νμ§ λͺ»ν©λλ€. κ·Έλ λ€λ©΄ μ΄ μ°¨μ΄λ μ΄λμ μ€λ κ±ΈκΉμ? μ€μ λ Όλ¬Έμ μμΈν λ€μ¬λ€λ³Ό νμκ° μμ΅λλ€.
μ°λ¦¬ κ³Όμ λ μΌλ°μ μΌλ‘ μμ΄μ νΈμ μν΄ μ§μ μ μΈ μν₯μ λ°μ§ μλ ν ν¬κ² λ³νμ§ μλ νκ²½μ μ¬μ©ν©λλ€. λ°λ©΄, μ€μ κ³Όμ λ μ’ μ’ λ³ννλ νκ²½μ λ§₯λ½μμ λ°μν©λλ€.
[β¦]
λ§μ°¬κ°μ§λ‘, λ¨ ν λ²μ μ€μμ λν΄ ν° νλν°λ₯Ό μ£Όλ κ³Όμ λ κ±°μ μμ΅λλ€. μ΄λ λΆλΆμ μΌλ‘ μΈκ° κΈ°μ€μ μμ§μ λλ μμ λΉμ©μ μ€μ΄κΈ° μν¨μ λλ€.
μ΄κ²μ μ κ° μννλ μμ λ€κ³Όλ μ ν λ€λ¦ λλ€.
METRμ νμ€ μΈκ³μ 볡μ‘ν¨μ μΈμ ν©λλ€. κ·Έλ€μ μμ λ€μ κ³Όμ μ λν΄ '볡μ‘λ λ±κΈ(messiness rating)'μ λ§λ€μκ³ , κ³Όμ λ€μ 'νκ· λ³΅μ‘λ'λ 16μ λ§μ μ 3.2μ μ λλ€.
METRμ μ μμ λ°λ₯΄λ©΄, μ κ° μ£Όλ‘ μ νλ μ’ λ₯μ μννΈμ¨μ΄ μμ§λμ΄λ§ μμ μ μ΅μ 7-8μ μ λμ μ μλ₯Ό λ°μ κ²μ λλ€. μννΈμ¨μ΄ μμ§λμ΄λ§ νλ‘μ νΈλ κ²½λ‘ μμ‘΄μ μ΄κ³ , λμ μ΄λ©°, λͺ νν λ°μ¬μ€μ μν©μ΄ μκΈ° λλ¬Έμ λλ€. μ λ 볡μ‘λ 13/16 μμ€μ λ¬νλ λ¬Έμ λ€μ λ€λ€λ³Έ μ λ μμ΅λλ€.
κ³Όμ 볡μ‘λκ° 1μ μ¦κ°νλ©΄ νκ· μ±κ³΅λ₯ μ΄ μ½ 8.1% κ°μν©λλ€.
METRμ΄ μΈ‘μ ν 볡μ‘λμ μν₯μ λ°νμΌλ‘ μΆμ ν΄λ³΄λ©΄, GPT-5λ 2μκ°μ§λ¦¬ μμ μ λν μ±κ³΅λ₯ μ΄ 70%μμ μ½ 40%λ‘ λ¨μ΄μ§ κ²μ λλ€. μ΄κ²μ΄ μ κ° κ²½νν νμ€κ³Ό λ λΆν©ν©λλ€.
μ λ μμν μ§λ₯λ§μΌλ‘ μ΄ λ³΅μ‘μ±μ ν΄κ²°ν μ μμμ§ νμ ν μ μμ΅λλ€. νκ²½μ νΌλκ³Ό νμ€μ λͺ¨νΈν¨μ λν κ°κ±΄ν¨μ κ·Όλ³Έμ μΌλ‘ 컨ν μ€νΈλ₯Ό μ κ΄λ¦¬νλ κ²μ λ¬λ € μμ΅λλ€. μ΄ λ¬Έμ λ₯Ό ν΄κ²°ν λ§λ² κ°μ λΉλ²μ μ°ΎκΈ° μ κΉμ§λ, μ€λ₯μ 볡리 ν¨κ³Όλ₯Ό κ΄λ¦¬νκΈ° μν΄ λ¬Έμ λ₯Ό μμ λ¨μλ‘ λλκ³ κ²μ¦ κ°λ₯ν 체ν¬ν¬μΈνΈλ₯Ό λλ μν¬νλ‘μ°κ° νμνλ€λ κ²μ΄ λΆλͺ ν©λλ€.
μ΄λ¬ν κ²μ¦ κ°λ₯ν 체ν¬ν¬μΈνΈλ μΈκ°μ΄ μ΄ν΄ν μ μμ΄μΌ(legible) ν©λλ€.

κ·Έλ λ€λ©΄, 'μ μ ν ν¬κΈ°'μ μμ λ¨μλ 무μμΌκΉμ?
μ μ ν ν¬κΈ°μ μμ λ¨μλ μμμΌ νκ³ , μνλ κ²°κ³Όλ₯Ό κ°κ²°νκ² μ€λͺ ν΄μΌ ν©λλ€.
μμ λ¨μκ° μλ£λμμ λμ μνλ κ²°κ³Όλ μΈκ°μ΄ μ΄ν΄ν μ μμ΄μΌ(human-legible) ν©λλ€. μ λ κ·Έκ²μ΄ μ΄ν΄ κ°λ₯ν λΉμ¦λμ€ κ°μΉλ₯Ό μ 곡ν΄μΌ νλ€κ³ μ£Όμ₯ν©λλ€. κΆκ·Ήμ μΌλ‘ μννΈμ¨μ΄μ μ¬μ©μλ μΈκ°(λλ μΈκ°μ κ°λ μ λͺ¨λΈλ§ν μμ€ν )μ΄ λ κ²μ΄κΈ° λλ¬Έμ λλ€. λ°λΌμ νλ‘μ νΈλ₯Ό λΆν΄νλ μ°μν λ°©λ²μ κ° μ²΄ν¬ν¬μΈνΈμμ μ΄ν΄ κ°λ₯ν λΉμ¦λμ€ κ°μΉλ₯Ό μ 곡νλ μμ μμ λ¨μλ‘ λͺ¨λΈλ§νλ κ²μ λλ€. μ΄λ LLMμ 컨ν μ€νΈ μ°½μ μ‘΄μ€νκ³ μ€λ₯ μ νλ₯Ό κ΄λ¦¬νλ λ° λμμ΄ λ κ²μ λλ€.
μννΈμ¨μ΄ μμ§λμ΄λ€μ μ΄λ―Έ λΉμ¦λμ€ κ°μΉλ₯Ό μ 곡νκ³ λͺ¨λ 컨ν μ€νΈμ λ²μ νμμ κΈ°μ€μ μν μ νλ μμ λ¨μμΈ User Storiesλ₯Ό μ μνμ΅λλ€. μ λ μ΄κ²μ΄ ν° λ¬Έμ λ₯Ό LLMμ΄ ν λ²μ ν΄κ²°ν μ μλ μμ λ¬Έμ λ€λ‘ λλλ λ° μ’μ μΆλ°μ μ΄λΌκ³ μκ°ν©λλ€. User Storiesλ 'μμ 'κ³Ό λ¬λ¦¬ μννΈμ¨μ΄ κ°λ°μ 볡μ‘νκ³ λμ μΈ νκ²½μμλ κ²¬κ³ ν μ¬μ©μ κ²°κ³Όλ¬Όμ μ§μ€ν©λλ€. Srihariλ μννΈμ¨μ΄ κ°λ° νλ‘μΈμ€μμ User Storiesμ κ°μΉμ λν΄ μ°μνκ² κΈμ μΌμΌλ©°, 볡μ‘ν μννΈμ¨μ΄ κ΅¬μΆ μμ μ μ ν©ν μμ±μ λ μ μ΄ν΄νκΈ° μν΄ κ·Έμ κΈμ μ½μ΄λ³΄μκΈΈ μΆμ²ν©λλ€.
μ 곡 κ°λ₯ν λΉμ¦λμ€ κ°μΉλ λͺ¨λ μ΄ν΄κ΄κ³μκ° μ΄ν΄νκ³ νλ ₯ν μ μλ κ²μ΄κΈ°λ ν©λλ€. μννΈμ¨μ΄λ κ°λ°μ νΌμ μ§κ³΅ μνμμ λ§λλ κ²μ΄ μλλλ€. ν, μ ν μμ μ, λΉμ¦λμ€ λ΄λΉμ, μ¬μ©μμ νλ ₯μ΄ νμν©λλ€. AI μμ΄μ νΈκ° λ€λ₯Έ μ΄ν΄κ΄κ³μλ€κ³Ό λΆλ¦¬λ μ체 컨ν μ€νΈ νκ²½μμ μλνλ€λ μ¬μ€μ ν¨μ¨μ±κ³Ό κ·Έ μ΄μ μ μ λ¬μ μ ν΄ν©λλ€. μ λ μ΄κ²μ΄ λ°λμ λ©μμ ΈμΌ ν μ€μν 격차λΌκ³ μκ°ν©λλ€.
μμ λ¨μ | ν¬κΈ° | μλ£ μ κ²°κ³Όλ¬Ό |
---|---|---|
TODO νλͺ© | μμ | μ μ§μ μΈ κΈ°μ μ κ°μΉ |
'κ³ν λͺ¨λ' | νΌ | κΈ°μ μ κ°μΉ |
Amazon Kiro Spec | μμ | κΈ°μ μ κ°μΉ |
User Story | μμ | λΉμ¦λμ€ κ°μΉ |
μ€λλ λλΆλΆμ AI μμ΄μ νΈλ μ μλνλ 'κ³ν(planning)' λͺ¨λλ₯Ό κ°μ§κ³ μμ΅λλ€. μ΄κ²μ μμ΄μ νΈκ° κΆ€λλ₯Ό λ²μ΄λμ§ μλλ‘ νλ λ°λ μ’μ§λ§, λλΆλΆ κΈ°μ μ κ°μΉλ₯Ό μ 곡ν λΏ λ°λμ μ΄ν΄ κ°λ₯ν λΉμ¦λμ€ κ²°κ³Όλ¬Όμ μ 곡νμ§λ μμ΅λλ€. μ λ κ³ν κΈ°λ₯μ΄ νλ‘μ νΈλ₯Ό μμ λΉμ¦λμ€ κ°μΉ λ¨μλ‘ λλλ μ°λ¦¬μ μμ΄λμ΄μ μνΈ λ³΄μμ μ΄λΌκ³ λ―Ώμ΅λλ€. μ κ° μ μνλ μμ λ¨μλ κΈ°μ‘΄μ κ³ν λκ΅¬λ‘ κ³νν μ μμ΅λλ€. κ·Έλ¦¬κ³ μ λ μ΄κ²μ΄ μμ μ€λͺ ν 컨ν μ€νΈ λΆν¨(context rot) λ¬Έμ λλ¬Έμ ν° μμ λ¨μλ₯Ό κ³ννλ κ²λ³΄λ€ μ°μνλ€κ³ μκ°ν©λλ€.
λ¬Όλ‘ , Agile λ°©λ²λ‘ μμ μ€λͺ νλ νλ²ν User Storiesλ§μΌλ‘λ μΆ©λΆνμ§ μμ΅λλ€. μμ΄μ νΈκ° μ€ν 리μ λΉμ¦λμ€ κ°μΉ κ²°κ³Όλ¬Όμ λΆν©νλ μ¬λ°λ₯Έ 컨ν μ€νΈλ₯Ό μμ§νλλ‘ μ λν μ μλ 'κ·Έ μ΄μμ 무μΈκ°'κ° λλ°λμ΄μΌ ν©λλ€.

source
Comments ()