Harness Engineering for AI: Conceptual Guide
ယခုစာတမ်းသည် AI နယ်ပယ်တွင် အခြေခံအကျဆုံးနှင့် လက်တွေ့အကျဆုံး အပြောင်းအလဲသစ်တစ်ခုဖြစ်သည့် Harness Engineering ဆိုင်ရာ နည်းပညာသဘောတရားများကို ကျောင်းသားများ လွယ်ကူစွာဖတ်ရှုနားလည်နိုင်ရန် စနစ်တကျ ပြုစုထားသော ပညာရပ်ဆိုင်ရာ လမ်းညွှန်ချက်ဖြစ်ပါသည်။
လက်တွေ့လေ့လာမှုများနှင့် Google Antigravity 2.0 System အကြောင်းကို ဆက်လက်ဖတ်ရှုလိုပါသလား။
Advanced Course01 Introduction to Harness Engineering
လက်ရှိ AI နည်းပညာလောကတွင် ပိုမိုရေပန်းစားလာသည့် ဝေါဟာရတစ်ခုမှာ Harness Engineering ဖြစ်ပါသည်။ ၎င်းသည် ယခင်က ခေတ်စားခဲ့သော Context Engineering မှ သိသာစွာ ဆင့်ကဲပြောင်းလဲလာသည့် နည်းပညာရပ်ဖြစ်ပြီး AI စနစ်များကို ပိုမိုထိရောက်စွာ ထိန်းချုပ်မောင်းနှင်ရန်အတွက် အရေးပါလှပါသည်။
သို့သော် Context Engineering တုန်းကကဲ့သို့ပင် လူအများစုသည် ဤစကားလုံး၏ တကယ့်အဓိပ္ပာယ်ကို သေသေချာချာ နားမလည်ဘဲ ခေတ်စားရုံသက်သက်သုံးစွဲသော စကားလုံး (Buzzword) အဖြစ် လိုက်လံသုံးနှုန်းနေကြပါသည်။ ထို့ကြောင့် ဤနည်းပညာဆိုင်ရာ တွေးခေါ်ပုံစနစ် (Mindset) ကို စနစ်တကျ လေ့လာသင်ယူရန် အလွန်ပင် လိုအပ်ပါသည်။
02 The Core Architecture Formula
Harness Engineering ဆိုသည်မှာ အခြေခံအားဖြင့် Model ၏ ဘေးပတ်လည်တွင် လုံခြုံစိတ်ချရသော စနစ်အခွံ (Wrapper) တည်ဆောက်ခြင်း ဖြစ်ပါသည်။ မည်သည့် Agent စနစ်မဆိုသည် အောက်ခြေတွင် ရှိနေသော Large Language Model (LLM) (ဥပမာ - GPT သို့မဟုတ် Claude) နှင့် ၎င်း၏ဘေးပတ်လည်မှ ပတ်ဝန်းကျင်အချက်အလက် (Context) များကို ပံ့ပိုးပေးပြီး လုပ်ငန်းစဉ်များကို စနစ်တကျ ကန့်သတ်ထိန်းချုပ်ပေးသည့် Wrapper တို့ ပေါင်းစပ်ထားခြင်း ဖြစ်သည်။
ဤအယူအဆကို AI coding assistants များနှင့် ကွန်ပျူတာ ပရိုဂရမ်ရေးဆွဲခြင်း လုပ်ငန်းများတွင် အဓိကထား အသုံးပြုလေ့ရှိသော်လည်း၊ လက်တွေ့တွင် သင်ကိုယ်တိုင် တည်ဆောက်မည့် မည်သည့် Agent အမျိုးအစားတွင်မဆို ထပ်တူအသုံးချနိုင်ပါသည်။
Harness Engineering တွင် အဓိကအားဖြင့် အပိုင်း (၂) ပိုင်း ပါဝင်ပါသည် - ပထမတစ်ခုမှာ တစ်ဦးချင်းစီ သီးခြားလုပ်ဆောင်သော individual AI coding assistant session ဖြစ်ပြီး၊ ဒုတိယတစ်ခုမှာ ပိုမိုကြီးမားသော လုပ်ငန်းစဉ်များကို ဖြေရှင်းရန်အတွက် Coding Agent Sessions အမြောက်အမြားကို ပေါင်းစပ်ဦးစီးမောင်းနှင်ခြင်း (Multi-session Orchestration) ပင် ဖြစ်သည်။
03 The 3-Layer Wrapper Hierarchy
စနစ်၏ အဆင့်ဆင့်ဖွဲ့စည်းပုံကို ကောင်းစွာနားလည်နိုင်ရန် အောက်ပါအတိုင်း အလွှာ ၃ ဆင့် ခွဲခြားကြည့်နိုင်ပါသည် -
၁။ Core Model: အောက်ခြေအဆင့်တွင် ရှိပြီး Agent ၏ တွေးခေါ်စဉ်းစားမှုနှင့် အကြောင်းအရာများကို နားလည်နိုင်မှု အပိုင်းကိုသာ တာဝန်ယူသည်။
၂။ Built-in Harness: သက်ဆိုင်ရာ ဆော့ဖ်ဝဲလ်ကုမ္ပဏီများက ၎င်းတို့၏ Model ဘေးပတ်လည်တွင် အသင့်ဖန်တီးပေးထားသော Harness ဖြစ်ပြီး သင်သည် ကိရိယာတစ်ခုကို ရွေးချယ်လိုက်သည်နှင့် ၎င်း Built-in Harness ကို တစ်ပါတည်း ရွေးချယ်ပြီးသား ဖြစ်သွားပါသည်။
၃။ Custom AI Layer: ဤအလွှာသည် သင်ကိုယ်တိုင် စိတ်ကြိုက်ပုံဖော် ဖန်တီးခွင့်ရသည့် အစိတ်အပိုင်း ဖြစ်သည်။ Agent များ လိုက်နာရမည့် လုပ်ငန်းစဉ်များ၊ စည်းကမ်းချက်များနှင့် အထူးစွမ်းဆောင်ရည်များကို သတ်မှတ်ရပြီး၊ ၎င်းတွင် global rules၊ skills၊ MCP servers၊ LSP / knowledge graphs၊ hooks နှင့် sub-agents စသည့် အဓိက အစိတ်အပိုင်း ၆ ခု ပါဝင်ပါသည်။
04 The Bridge Analogy (တံတားဥပမာ)
အပေါ်ဘက်တံတားများနှင့် အောက်ဘက်တံတားများ - သီးခြားရပ်တည်နေသည့် LLM တစ်ခုတည်းသည် စွမ်းဆောင်ရည် သိပ်မရှိပါ။ ၎င်းတွင် မည်သည့် File System ကိုမဆို ဝင်ရောက်ကြည့်ရှုခွင့် သို့မဟုတ် Command များကို run နိုင်စွမ်း လုံးဝမရှိပါ။ ကျွန်ုပ်တို့ အသုံးပြုနေသော ပထမဦးဆုံး Harness Layer ကသာ ပြင်ပပတ်ဝန်းကျင်နှင့် ချိတ်ဆက်နိုင်ရန် "အထက်ဘက်တံတားများ (Upper Bridges)" ကို တည်ဆောက်ပေးထားခြင်း ဖြစ်သည်။ ၎င်းသည် စနစ်အတွင်း တည်ဆောက်ထားသည့် စွမ်းဆောင်ရည်များနှင့် System Prompt တို့ ပေါင်းစပ်ထားခြင်း ဖြစ်သည်။
ထို့ထက်ပိုမိုမြင့်မားသည့် "အောက်ဘက်တံတားများ (Lower Bridges)" ကတော့ AI Layer အဆင့် ဖြစ်ပြီး၊ ကျွန်ုပ်တို့ ကိုယ်တိုင်သတ်မှတ်နိုင်သည့် MCP servers၊ စိတ်ကြိုက် skills များနှင့် စည်းမျဉ်းများ ပါဝင်လာကာ AI Agent အား လက်တွေ့လုပ်ငန်းခွင်တွင် အမှန်တကယ် စွမ်းရည်ပြည့်ဝစွာ အသုံးချနိုင်စေရန် ကူညီပေးခြင်း ဖြစ်ပါသည်။
05 The Skill Issue Reframe: System Evolution Mindset
ဤနေရာတွင် အရေးအကြီးဆုံး မေးခွန်းမှာ "ဒါတွေဟာ Context Engineering သက်သက်ပဲ မဟုတ်ဘူးလား" ဆိုသည်ပင် ဖြစ်သည်။ အဖြေမှာ တစ်စိတ်တစ်ပိုင်းအားဖြင့် ဟုတ်သော်လည်း တကယ့် ဆင့်ကဲပြောင်းလဲမှု (Evolution) တွင် အရေးကြီးသည့် ကွဲပြားချက်တစ်ခု ရှိပြီး၊ ၎င်းမှာ "Skill Issue Reframe" (တွေးခေါ်ပုံစနစ် ပြောင်းလဲခြင်း) ပင် ဖြစ်သည်။
"အင်ဂျင်နီယာအများစုသည် Agent က တစ်ခုခု လွဲချော်လိုက်သည်နှင့် Model ကိုသာ အပြစ်တင်ပြီး 'နောက်ထွက်မည့် Version (ဥပမာ - GPT-6) ကျမှပဲ သုံးတော့မည်' ဆိုကာ အလွယ်တကူ လက်လျှော့လိုက်ကြလေ့ ရှိသည်။"
Harness Engineering Mindset ကမူ ထိုကဲ့သို့ လက်လျှော့ခြင်းကို လုံးဝငြင်းပယ်ပြီး ၎င်းကို "System Evolution" (စနစ်တကျ တိုးတက်ပြောင်းလဲစေခြင်း) တွေးခေါ်ပုံစနစ်ဖြင့် အစားထိုး တုံ့ပြန်ပါသည်။
အေးဂျင့်လုပ်မိသည့် အမှားများမှာ တကယ်တော့ စနစ်ကို ပြင်ဆင်ရန် အလွန်ရှင်းလင်းသော သဲလွန်စများ ဖြစ်ပါသည်။ ဥပမာ - အေးဂျင့်သည် စနစ်အတွင်းရှိ ရေးထုံးများကို နားမလည်ပါက ၎င်းကို agents.mmd ဖိုင်ထဲသို့ စာသားထည့်သွင်းပေးလိုက်ပါ။ သို့မဟုတ် အေးဂျင့်သည် အဖျက်သဘောဆောင်သော Command မျိုးကို မှားယွင်းစွာ run ခဲ့ပါက၊ ၎င်းကို ကြားဖြတ်တားဆီးမည့် Hook တစ်ခု တည်ဆောက်ပေးလိုက်ပါ။
အဓိက စိတ်ကူးမှာ "အေးဂျင့်လုပ်မိသော အမှားတိုင်းသည် စည်းမျဉ်းသစ်တစ်ခု ဖြစ်လာသည်" (Every mistake becomes a rule) ဆိုသည်ပင် ဖြစ်သည်။ ဤနည်းလမ်းဖြင့် သင်ဖန်တီးထားသော AI Layer ကို အဆင့်မြှင့်တင်ခြင်းဖြင့် နောက်ဆက်တွဲ session များတွင် အဆိုပါ ပြဿနာမျိုး ထပ်မံမပေါ်ပေါက်စေရန် အမြဲတမ်း ကာကွယ်ပေးနိုင်မည် ဖြစ်သည်။
06 The Companion AI Layer Structure
သင်၏ Codebase တိုင်းတွင် အသုံးချနိုင်မည့် AI Layer ၏ လက်တွေ့ကျသော အဓိက အစိတ်အပိုင်းများမှာ အောက်ပါအတိုင်း ဖြစ်သည် -
သင်၏ coding agent က မဖြစ်မနေ လိုက်နာရမည့် စည်းကမ်းချက်များနှင့် ရေးထုံးများ (Patterns) ဖြစ်ပြီး Markdown စာရွက်စာတမ်းများအဖြစ် ရေးသားသိမ်းဆည်းထားနိုင်သည်။
အေးဂျင့်မှ အဆင့်ဆင့် လုပ်ဆောင်ရမည့် လုပ်ငန်းစဉ်များ (Planning, Implementation, Validation) ဖြစ်သည်။ အထူးအကြံပြုလိုသည်မှာ ဤအဆင့် (၃) ခုလုံးကို သီးခြားစီ သီးသန့် coding agent sessions များ ခွဲခြားလုပ်ဆောင်ရန် ဖြစ်သည်။ ၎င်းသည် Token Efficiency ကို ဖြစ်စေပြီး အာရုံစိုက်မှုကို ပိုမိုအားကောင်းစေသည်။
လုံခြုံရေးအတွက် Pre-tool use hook ကို သုံးပြီး အေးဂျင့်မှ မည်သည့် Command ကိုမဆို မ run မီ သို့မဟုတ် ဖိုင်မရေးမီ စိစစ်တားဆီးနိုင်သည်။ ထို့အပြင် အေးဂျင့်မှ လုပ်ငန်းပြီးဆုံးကြောင်း ပြောသည့်အခါ Stop validation hook ကို အသုံးပြု၍ Unit Tests များကို အလိုအလျောက် run စေပြီး မအောင်မြင်ပါက အေးဂျင့်အား ထပ်မံပြင်ဆင်စေရန် အတင်းအကျပ် ခိုင်းစေနိုင်သည်။
07 Multi-Session Orchestration & Ralph (RA) Loops
Harness Engineering ၏ အဆင့်မြင့်ဆုံး ပုံစံမှာ coding agent sessions အမြောက်အမြားကို စနစ်တကျ စုစည်းဦးစီးမောင်းနှင်ခြင်း (Orchestration) ပင် ဖြစ်သည်။
အဓိက စိတ်ကူးမှာ ကြီးမားလှသော လုပ်ငန်းတစ်ခုလုံးကို coding agent session တစ်ခုတည်းဆီသို့ အကုန်လုံး တိုက်ရိုက်သွားရောက်မပေးအပ်ရန် ဖြစ်သည်။ ၎င်းသည် LLM ကို လုံးဝ ဝန်ပိသွားစေပြီး အမှားအယွင်းများစွာ ပြုလုပ်လာစေလိမ့်မည်။
ထို့ကြောင့် ကြီးမသော လုပ်ငန်းစဉ်ကို သီးခြားစီ အသေးစိတ်ခွဲခြမ်းစိတ်ဖြာပြီး အာရုံစိုက်မှုအရှိဆုံး လုပ်ငန်းတစ်ခုစီကိုသာ coding agent တစ်ခုချင်းစီထံ ခွဲဝေပေးအပ်ရမည် ဖြစ်သည်။ ဤလုပ်ငန်းစဉ်ကို အလိုအလျောက် ပေါင်းစပ်လည်ပတ်စေရန် Ralph loop ကို အသုံးပြုနိုင်သည်။
Python သို့မဟုတ် Bash ဖြင့် ရေးသားထားသော ရိုးရှင်းသော Script တစ်ခုသည် ကြီးမားသော လုပ်ငန်းပမာဏကို သီးခြားလုပ်ငန်းခွဲလေးများအဖြစ် ခွဲခြမ်းကာ အလုပ်တစ်ခုစီတိုင်း ပြီးဆုံးအောင်မြင်သည်အထိ coding agent sessions များကို အဆင့်ဆင့် စဉ်ဆက်မပြတ် စေလွှတ်လည်ပတ်ပေးသည်။ လုပ်ငန်းစဉ်အားလုံး ပြီးမြောက်သွားသည့်အခါ done.txt ဖိုင်ကို ထုတ်ပေးပြီး Loop အတွင်းမှ အလိုအလျောက် ထွက်ခွာသွားသည်။
08 Interactive Harness Simulator Playground
ကျောင်းသားများ Harness ၏ သဘောတရားကို ပိုမိုမျက်စိဖြင့်မြင်သာစေရန် အောက်ပါ ခလုတ်များကို ဖွင့်/ပိတ် လုပ်ဆောင်ပြီး "Run Simulation" ကို နှိပ်၍ စမ်းသပ်ကြည့်ပါ။