Files
recordingtest/docs/history/2026-04-07_이슈2-harness-design-planner-evaluator-도입.md
minsung 7ffbb1f757 Set up AI dev environment for recordingtest (#2)
- CLAUDE.md with collaboration rules and Planner/Generator/Evaluator cycle
- .claude/ agents, commands, skills, hooks per Claude Code conventions
- Sprint Contracts for sut-prober, normalizer, recorder, player, diff-reporter
- SUT catalog (EG-BIM Modeler, 187 plugins) and .gitignore excluding SUT tree
- PROGRESS.md / PLAN.md as shared agent handoff state
- Solution scaffold targeting sut-prober PoC

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-07 13:57:20 +09:00

1.6 KiB

2026-04-07 이슈 #2 — Planner/Evaluator 에이전트 & Sprint Contract 도입

배경

Anthropic "Harness Design for Long-Running Agent Applications" 기사를 읽고, 핵심 원칙을 recordingtest에 반영.

추가된 것

에이전트

  • .claude/agents/planner.md — 요청 → Sprint Contract + PLAN.md 엔트리. 구현 금지.
  • .claude/agents/evaluator.md — 완료된 모듈을 Sprint Contract 기준으로 독립 채점. 자기 작업 평가 금지.

커맨드

  • .claude/commands/contract.md/contract <name>
  • .claude/commands/evaluate.md/evaluate <name>

CLAUDE.md

  • §0.1 "작업 사이클 — Planner → Generator → Evaluator" 섹션 신설
  • Sprint Contract / DoD 객관성 / 독립 평가 원칙 명시
  • 컨텍스트 위생: compaction 대신 reset, Stop hook 경고 준수, scaffolding audit 상시 항목
  • 디렉터리 구조에 docs/contracts/, PROGRESS.md, PLAN.md 추가

메모리

  • project_recordingtest_harness_design.md 신규
  • MEMORY.md 인덱스 갱신

원칙 요약

  1. 생성자와 평가자는 같은 에이전트가 겸하지 않는다.
  2. DoD는 객관적으로 검증 가능해야 한다.
  3. 컨텍스트가 차면 요약하지 말고 파일에 쏟고 리셋.
  4. evaluator fail → PROGRESS.md에 done으로 넘기지 않는다.
  5. .claude/ 비계는 주기적으로 감사·축소.

다음 단계

PROGRESS.md / PLAN.md 실제 부트스트랩 (첫 번째 Sprint Contract 작성부터).