- Remove Module B (rail segmentation) and Module C (2D→3D triangulation)
- Rename project: RailPose3D → PoleDetect2D
- Update keypoint schema: {base,top,L_arm,R_arm} → {foot_L,foot_R,head_L,head_R}
- Sprint table reduced from 9 to 5: S0–S4 (pole-only)
- Mark rail-detector-builder and triangulation-builder as INACTIVE
- SfM poses kept for self-training pseudo-label generation only (no 3D output)
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2.9 KiB
2.9 KiB
PoleDetect2D — PLAN
이 문서는 불변 기준선(baseline) 이다. 일상 진행 상태는 PROGRESS.md 에 기록한다. 자세한 배경·근거는 docs/plan.md, docs/research.md 참조.
Goal
드론 영상(nadir + oblique) 으로부터 라멘구조 전철주(portal-frame catenary pole) 를 2D 이미지상에서 정확히 검출한다. 출력은 keypoint 좌표 (픽셀) + 신뢰도이며, 3D 좌표 추출은 이 프로젝트 범위 밖이다.
핵심 설계 결정 (불변)
- Pose/keypoint 모델 (bbox 아님). 라멘구조 4-keypoint
{foot_L, foot_R, head_L, head_R}로 기둥 발목/머리를 구조적으로 구분한다. - 라멘구조 전용 스키마. 두 수직 기둥과 연결 보(beam)를 가진 H-frame / 문형 가구 구조.
- Self-training over SfM. 30장 라벨을 SfM 카메라 포즈 reprojection 으로 5–20× 증식하여 2D pseudo-label 생성.
- Zero-shot bootstrap 우선. Grounding-DINO + SAM2 로 라벨 없이 시작.
단일 모듈 구성
- Module A — Pole Keypoint Detection
- 대상: 라멘구조 전철주 (portal-frame, 문형 가구)
- 모델: RTMPose-m (primary) / ViTPose-Base (fallback)
- Keypoint:
{foot_L, foot_R, head_L, head_R}— COCO-keypoints 포맷
Sprint 분할 (마일스톤)
| Sprint | 목표 | 성공 조건 (contract) |
|---|---|---|
| S0 Bootstrap | 디렉터리·환경·CI 골격 | pipeline/run_detect.py --version 동작, lint/format pass |
| S1 MVP-Zero | Grounding-DINO+SAM2 zero-label baseline | 30장 pole keypoint 픽셀 오차 baseline 정량화 |
| S2 Pole-Train | RTMPose-m fine-tune (30장→300장 copy-paste aug) | PCK@5px ≥ S1 baseline + 20% |
| S3 Self-train | SfM-consistent self-training loop (2D pseudo-label) | 라운드 N+1 PCK > 라운드 N, 3라운드 연속 |
| S4 Korean-variants | 라멘구조 vs 단주 분류 분기, 다형 keypoint | 두 타입 PCK@5px ≥ 0.85 |
각 sprint 는 시작 시 /contract <sprint-id> 로 contract 파일을 생성하고, 완료 시 /eval A 로 검증한다.
검증 기준 (정량 지표)
- Module A: PCK@5px (4 keypoint 전체, 특히 foot_L / foot_R), 30장 holdout
- 기준 파일:
data/eval/pole_pck.json
위험 관리
| 위험 | 대응 |
|---|---|
| 기둥 하단(foot)이 ballast·식생에 가려짐 | SfM pseudo-label 로 다른 뷰의 가시 foot 활용 |
| 라멘구조 외 단주 혼입 | S4 에서 pole_type 분기 처리 |
| 한국 catenary 다양성 (간격·폭 다양) | copy-paste aug 시 scale 범위 확장 |
| Windows MMPose 빌드 | conda-forge wheel, ONNX export fallback |
참고 산출물
- docs/plan.md — 사용자 승인 plan (한국어, 자세한 근거)
- docs/research.md — 초기 기술 조사
- 메모리:
~/.claude/projects/d--MYCLAUDE-PROJECT-detectelectronpole/memory/