ハーネスフォルダを作ってSWE改善
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
* 目次 [#x325b63f]
#contents
* 主張 [#beac300e]
モデル性能より運用(ハーネス)で差がつく
** よくある失敗例: [#ub7a326a]
- stateがなく、会話ログだけを頼りに再開する
- AIが「終わった」と誤認し、未完タスクを放置する
- 方針変更が会話中に起き、誰も気づかない
これらはすべて「正本が存在しない」ことが原因である。
* SWEの分解式 [#p6a8ab03]
SWE≈1−(1−Π(Pi×Ci))k
※ これは厳密な数学モデルではなく、運用改善ポイントを可視...
- ハーネスはCi(文脈保持)を1 に近づけ
- QdrantはPi(判断精度)を底上げし
- State管理はk(有効再試行) を増やす
Qdrantは必須ではない。
本記事のハーネスは「ファイル正本」だけでも成立する。
Qdrantは「過去の理由や議論を思い出す」ための補助輪である。
** リポジトリ直下にこれを作る [#u0964ff2]
/harness
/spec
feature_list.yaml
constraints.md
/state
state.yaml
progress.md
open_questions.md
/run
session_plan.md
session_report.md
/logs
decisions.md
*** 説明 [#zb7677e0]
- feature_list.yaml = 完了条件(これが“終わった判定”の基...
- state.yaml = 現在の確定状態(最新版はここ)
- progress.md = 人間が読む引き継ぎ(短文)
- decisions.md = 意思決定ログ(なぜそうしたか)
- open_questions.md = 未解決論点(ここを放置しない)
* Initializer エージェント(設定してくれる役) [#d4f1936c]
Initializer は原則として「最初」または「大きな方針転換時...
通常の作業では Worker だけを回す。
あなたは「Harness Initializer」です。長期稼働エージェン...
目的:
- このリポジトリで長期タスクを安全に継続できるよう、/har...
- 次回以降の作業エージェントが「何を読めばよいか」「何を...
必須成果物(作成・更新):
1) /harness/spec/feature_list.yaml
- 完了条件をチェックリスト化する
- 各項目に id, description, acceptance_criteria, stat...
2) /harness/state/state.yaml
- 現在の確定方針・制約・重要変数(採用技術、方針、前...
3) /harness/state/progress.md
- 直近の進捗、現状、次の一手を短く
4) /harness/logs/decisions.md
- 主要な決定と理由を追記(決定ID、日付、要約、理由、...
5) /harness/state/open_questions.md
- 未確定事項を列挙し、解決のための最小質問を添える
ルール:
- 会話やコードから読み取れる事実だけを書く。推測は "Assu...
- 正本は /harness/state/state.yaml。ここに書かれた内容が...
- 進捗やログは短く、重複を書かない(stateに寄せる)。
- 完了条件(feature_list)が空/曖昧なら、最小の粒度に分...
出力:
- まず、作成/更新するファイル一覧と、その中身を提示する...
- 次に、Workerエージェントが次回読むべき順序(読み込み手...
* Worker エージェント(継続実装役) [#i9f9ee37]
あなたは「Harness Worker」です。/harness を正本として、...
開始手順(必須):
1) /harness/state/state.yaml を読む(これが最新版)
2) /harness/spec/feature_list.yaml を読む(完了条件と未...
3) /harness/state/progress.md と /harness/state/open_que...
4) 必要なら /harness/logs/decisions.md を参照(理由の整...
作業ルール:
- 1セッションでやるのは「小さな1〜3タスク」だけ。未完の...
- 変更後は必ず「検証」をする(テスト、ビルド、動作確認、...
- セッション終了時に必ず /harness/state/progress.md と f...
- 仕様や方針を変える必要がある場合は、勝手にstateを書き...
セッション終了条件(必須):
- 作業結果が保存されている(ファイル更新)
- 進捗が更新されている(progress, feature_list)
- 次の一手が明確(progressに Next を書く)
- 未解決の判断は open_questions に隔離されている
出力:
- 今回やったこと(Done)
- 検証結果(Verify)
- 次にやること(Next)
- 更新したファイル一覧(Files)
*** もし「Excel正本」もやるなら(企業向け) [#u2d61b5d]
Excelを正本にする場合は、Workerのルールにこれを足すだけで...
state.yaml の代わりに “Excel(Nodes/Edges/Decisions)” ...
Workerは毎回「Excel→state.yamlへ“同期用サマリ”を生成」し...
つまり Excelが公式、state.yamlがAI用キャッシュ になります。
* feature_list.yaml のテンプレ [#y14b3023]
features:
- id: F-001
description: "(例)資格管理の一覧画面を表示できる"
acceptance_criteria:
- "一覧取得APIが200で返る"
- "空状態・エラー状態が表示できる"
status: todo
- id: F-002
description: "(例)新規登録ができる"
acceptance_criteria:
- "バリデーションが動く"
- "登録後に一覧へ反映される"
status: todo
status: done # acceptance_criteria をすべて満たした場合...
終了行:
* 目次 [#x325b63f]
#contents
* 主張 [#beac300e]
モデル性能より運用(ハーネス)で差がつく
** よくある失敗例: [#ub7a326a]
- stateがなく、会話ログだけを頼りに再開する
- AIが「終わった」と誤認し、未完タスクを放置する
- 方針変更が会話中に起き、誰も気づかない
これらはすべて「正本が存在しない」ことが原因である。
* SWEの分解式 [#p6a8ab03]
SWE≈1−(1−Π(Pi×Ci))k
※ これは厳密な数学モデルではなく、運用改善ポイントを可視...
- ハーネスはCi(文脈保持)を1 に近づけ
- QdrantはPi(判断精度)を底上げし
- State管理はk(有効再試行) を増やす
Qdrantは必須ではない。
本記事のハーネスは「ファイル正本」だけでも成立する。
Qdrantは「過去の理由や議論を思い出す」ための補助輪である。
** リポジトリ直下にこれを作る [#u0964ff2]
/harness
/spec
feature_list.yaml
constraints.md
/state
state.yaml
progress.md
open_questions.md
/run
session_plan.md
session_report.md
/logs
decisions.md
*** 説明 [#zb7677e0]
- feature_list.yaml = 完了条件(これが“終わった判定”の基...
- state.yaml = 現在の確定状態(最新版はここ)
- progress.md = 人間が読む引き継ぎ(短文)
- decisions.md = 意思決定ログ(なぜそうしたか)
- open_questions.md = 未解決論点(ここを放置しない)
* Initializer エージェント(設定してくれる役) [#d4f1936c]
Initializer は原則として「最初」または「大きな方針転換時...
通常の作業では Worker だけを回す。
あなたは「Harness Initializer」です。長期稼働エージェン...
目的:
- このリポジトリで長期タスクを安全に継続できるよう、/har...
- 次回以降の作業エージェントが「何を読めばよいか」「何を...
必須成果物(作成・更新):
1) /harness/spec/feature_list.yaml
- 完了条件をチェックリスト化する
- 各項目に id, description, acceptance_criteria, stat...
2) /harness/state/state.yaml
- 現在の確定方針・制約・重要変数(採用技術、方針、前...
3) /harness/state/progress.md
- 直近の進捗、現状、次の一手を短く
4) /harness/logs/decisions.md
- 主要な決定と理由を追記(決定ID、日付、要約、理由、...
5) /harness/state/open_questions.md
- 未確定事項を列挙し、解決のための最小質問を添える
ルール:
- 会話やコードから読み取れる事実だけを書く。推測は "Assu...
- 正本は /harness/state/state.yaml。ここに書かれた内容が...
- 進捗やログは短く、重複を書かない(stateに寄せる)。
- 完了条件(feature_list)が空/曖昧なら、最小の粒度に分...
出力:
- まず、作成/更新するファイル一覧と、その中身を提示する...
- 次に、Workerエージェントが次回読むべき順序(読み込み手...
* Worker エージェント(継続実装役) [#i9f9ee37]
あなたは「Harness Worker」です。/harness を正本として、...
開始手順(必須):
1) /harness/state/state.yaml を読む(これが最新版)
2) /harness/spec/feature_list.yaml を読む(完了条件と未...
3) /harness/state/progress.md と /harness/state/open_que...
4) 必要なら /harness/logs/decisions.md を参照(理由の整...
作業ルール:
- 1セッションでやるのは「小さな1〜3タスク」だけ。未完の...
- 変更後は必ず「検証」をする(テスト、ビルド、動作確認、...
- セッション終了時に必ず /harness/state/progress.md と f...
- 仕様や方針を変える必要がある場合は、勝手にstateを書き...
セッション終了条件(必須):
- 作業結果が保存されている(ファイル更新)
- 進捗が更新されている(progress, feature_list)
- 次の一手が明確(progressに Next を書く)
- 未解決の判断は open_questions に隔離されている
出力:
- 今回やったこと(Done)
- 検証結果(Verify)
- 次にやること(Next)
- 更新したファイル一覧(Files)
*** もし「Excel正本」もやるなら(企業向け) [#u2d61b5d]
Excelを正本にする場合は、Workerのルールにこれを足すだけで...
state.yaml の代わりに “Excel(Nodes/Edges/Decisions)” ...
Workerは毎回「Excel→state.yamlへ“同期用サマリ”を生成」し...
つまり Excelが公式、state.yamlがAI用キャッシュ になります。
* feature_list.yaml のテンプレ [#y14b3023]
features:
- id: F-001
description: "(例)資格管理の一覧画面を表示できる"
acceptance_criteria:
- "一覧取得APIが200で返る"
- "空状態・エラー状態が表示できる"
status: todo
- id: F-002
description: "(例)新規登録ができる"
acceptance_criteria:
- "バリデーションが動く"
- "登録後に一覧へ反映される"
status: todo
status: done # acceptance_criteria をすべて満たした場合...
ページ名: