문서 정리: Phase 히스토리 md를 docs/history/로 이동 + 오래된 테스트/에셋 정리

- 루트의 IMPROVEMENT-PHASE-*.md, PHASE-*.md 등 45개 → docs/history/로 이동
- docs/block-tests/ 오래된 블록 테스트 HTML 삭제 (figma_to_html_agent로 대체)
- docs/figma-analysis/, docs/figma-assets/, docs/figma-screenshots/ 정리
- docs/test-*.html 등 초기 테스트 파일 정리
- 참고 페이지/ 스크린샷 정리

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-04-13 10:56:23 +09:00
parent d57860578f
commit c42e01f060
206 changed files with 0 additions and 13498 deletions

View File

@@ -0,0 +1,464 @@
# 파이프라인 프로세스 재검토 — 검증 시점 문제 진단
> Phase I 실행 완료 후 실제 구동 중 발견된 프로세스 구조 문제.
> Phase I의 코드 변경(14개 항목)은 유효하나, **검증이 배치된 시점**이 부적절.
---
## 현재 프로세스 흐름 (as-is)
```
[1단계] Kei 실장 — 콘텐츠 분석 + 스토리라인 설계
├ 1-A: 꼭지 추출 (Kei API)
├ 1-B: 컨셉 구체화 (Kei API)
├ 제목 중복 검증 (코드)
└ 이미지 크기 측정 (Pillow)
[2단계] 디자인 팀장 — 레이아웃 + 블록 매핑
├ Step A: 프리셋 선택 (규칙 기반)
├ Step A-2: Opus 블록 추천 (Kei API)
├ Step B: Sonnet 블록 매핑
└ 블록 검증 (코드): 미등록 교체, zone 교정, pill-pair, 높이 예산 체크
[2.5단계] ⚠️ Kei 넘침 판단 — 예상 높이 기반
[3단계] Kei 편집자 — 텍스트 채움 (Kei API)
[4단계] 디자인 실무자 — CSS 조정 + HTML 렌더링 (Sonnet + Jinja2)
[5단계] 디자인 팀장 — 재검토 + 조정 루프 (Sonnet, 최대 2회)
미리보기 + HTML 다운로드
```
---
## 각 시점에서 알 수 있는 정보
| 시점 | 원본 텍스트 | 꼭지 분석 | 블록 배치 | 실제 텍스트 | 렌더링 HTML | 실제 높이 |
|------|:---------:|:--------:|:--------:|:---------:|:----------:|:--------:|
| 1단계 후 | O | O | - | - | - | - |
| 2단계 후 | O | O | O | - | - | 예상만 |
| 2.5단계 | O | O | O | **없음** | **없음** | 예상만 |
| 3단계 후 | O | O | O | **O** | - | - |
| 4단계 후 | O | O | O | O | **O** | 측정 가능 |
| 5단계 | O | O | O | O | O | 측정 가능 |
---
## 문제 진단 (6건)
### 문제 1: 내용 없이 넘침 판단
**위치:** Stage 2.5
**현상:** Kei에게 "이 zone이 넘친다"고 전달하지만, 실제 텍스트가 없는 상태. 블록 타입의 예상 높이(medium=150px, large=250px)만으로 판단 요청.
**문제:** Kei가 "trim할까 restructure할까"를 결정하려면 실제 콘텐츠를 봐야 하는데 볼 수 없음. 판단 근거가 부족한 상태에서 판단을 요청.
---
### 문제 2: 예상 높이 초과 → 판단 주체 잘못됨
**위치:** Stage 2.5
**현상:** Sonnet에게 이미 "zone 예산 490px, height_cost 확인해서 초과하지 마라"고 프롬프트로 지시함. 그런데도 예상 높이가 초과하면 그건 **Sonnet이 지시를 안 따른 것**.
**문제:** Sonnet의 지시 불이행을 Kei에게 물어볼 문제가 아님. Sonnet을 다시 호출하거나 프롬프트를 개선할 문제. 판단 주체와 해결 주체가 불일치.
---
### 문제 3: 실제 HTML이 있는데 넘침을 안 봄
**위치:** Stage 5
**현상:** 렌더링된 HTML이 있고, 각 블록의 실제 텍스트 양도 알 수 있는 시점. 그러나 현재 Stage 5의 점검 항목은 "빈 블록, 채움 불균형, 정보량, HTML 구조"만.
**문제:** 정작 "컨테이너에 실제로 넘치는가"는 점검 항목에 없음. 넘침을 확인할 수 있는 최적의 시점에서 확인하지 않음.
---
### 문제 4: 넘침 판단에 Kei가 없음
**위치:** Stage 5
**현상:** Stage 5 재검토는 Sonnet이 단독으로 수행. 조정도 expand/shrink/rewrite를 Sonnet이 결정.
**문제:** 넘침 발생 시 "뭘 줄이고 뭘 팝업으로 분리할지"는 **콘텐츠 중요도 판단** — Kei가 해야 할 일. 현재 Stage 5에 Kei 참여 경로가 없음.
---
### 문제 5: 실제 렌더링 높이 측정 수단 없음
**위치:** 전체 파이프라인
**현상:** 파이프라인 어디에서도 렌더링된 HTML의 실제 px 높이를 측정하지 않음.
- Stage 2: 블록 타입 기반 예상 높이 (HEIGHT_COST_PX: compact=70, medium=150, large=250, xlarge=400)
- Stage 5: Sonnet이 HTML 코드를 읽고 눈대중으로 판단
**문제:** 예상 높이와 실제 높이는 다를 수 있음. 텍스트 양, CSS 조정, 폰트 크기에 따라 실제 높이가 달라지는데 이를 측정하는 코드가 없음.
---
### 문제 6: 넘침이 재검토 루프에 포함 안 됨
**위치:** Stage 5 루프
**현상:** Stage 5는 `재검토 → 조정 → fill_content(Stage 3) → render(Stage 4) → 재검토` 루프가 있음 (최대 2회).
**문제:** 이 루프 안에 넘침 판단이 없음. 조정 후에도 여전히 넘칠 수 있는데, expand 조정으로 텍스트가 늘어나서 오히려 더 넘칠 수도 있음. 루프가 넘침을 감지하지 못함.
---
## 문제 요약 매트릭스
| # | 문제 | 위치 | 핵심 원인 | 영향 |
|---|------|------|----------|------|
| 1 | 내용 없이 넘침 판단 | 2.5 | 텍스트 채움 전에 판단 | Kei 판단 근거 부족 → 부정확한 결정 |
| 2 | 예상 높이 초과 → Kei에게 물음 | 2.5 | 판단 주체 잘못됨 | Sonnet 지시 불이행을 Kei가 해결할 수 없음 |
| 3 | HTML 있는데 넘침 안 봄 | 5 | 점검 항목 누락 | 실제 넘침 감지 못함 |
| 4 | 넘침 판단에 Kei 없음 | 5 | Sonnet만 참여 | 콘텐츠 중요도 무시한 조정 |
| 5 | 실제 높이 측정 없음 | 전체 | 측정 수단 부재 | 예상과 실제의 차이 감지 불가 |
| 6 | 넘침이 루프에 없음 | 5 루프 | 넘침 체크 미포함 | 조정 후 넘침 악화 가능 |
---
## 원인 관계
```
근본 원인: Stage 2.5의 넘침 판단 위치가 기존 DOWNGRADE_MAP 위치를 그대로 따름
메커니즘만 변경(DOWNGRADE → Kei), 시점은 재검토 안 함
내용 없이 판단(문제 1) + 주체 잘못됨(문제 2)
실제 넘침이 감지되는 시점(Stage 4 이후)에는 검증 없음(문제 3, 4, 6)
애초에 실제 높이 측정 수단도 없음(문제 5)
```
---
## 해결 방안 조사 결과
### 방안 1: 실제 렌더링 높이 측정 (문제 5 해결)
현재 파이프라인에는 렌더링된 HTML의 실제 px 높이를 측정하는 수단이 없음.
| 도구 | 정확도 | 속도 | CSS Grid | CSS 변수 | 커스텀 폰트 | 설치 상태 |
|------|--------|------|----------|----------|------------|----------|
| **Playwright** | 픽셀 정확 | 20~50ms/요소 | 완전 지원 | 완전 지원 | 완전 지원 | 미설치 |
| Selenium | 픽셀 정확 | 50~150ms/요소 | 완전 지원 | 완전 지원 | 완전 지원 | **설치됨** (4.34.0) |
| WeasyPrint | 제한적 | 200~500ms | 부분 지원 | 제한적 | 지원 | **설치됨** (65.1) |
| 텍스트 추정 | ±15~30% 오차 | <1ms | 불가 | 불가 | 불가 | — |
**권장: Playwright** — 가장 정확하고 빠름. 비동기 지원. headless Chromium 자동 설치.
**차선: Selenium** — 이미 설치됨. 동기식이라 약간 느리지만 충분히 사용 가능.
**측정 방식:**
```python
# Playwright 예시
async with async_playwright() as p:
browser = await p.chromium.launch()
page = await browser.new_page(viewport={"width": 1280, "height": 720})
await page.set_content(html)
# 각 zone의 실제 높이 측정
body_box = await page.locator("[data-zone='body']").bounding_box()
actual_height = body_box["height"] # 실제 렌더링 px
# overflow 감지: scrollHeight > clientHeight
overflow = await page.evaluate("""
el => el.scrollHeight > el.clientHeight
""", await page.query_selector("[data-zone='body']"))
```
---
### 방안 2: Stage 2.5 → Stage 5로 이동 (문제 1, 2, 3, 4, 6 해결)
**현재:** Stage 2.5에서 텍스트 없이 Kei 판단 → 근거 부족
**개선:** Stage 4(렌더링) 이후, Stage 5(재검토) 안에서 넘침 판단
```
현재:
Stage 2 → [2.5 Kei 넘침 판단] → Stage 3 → Stage 4 → Stage 5(Sonnet만)
개선:
Stage 2 → Stage 3 → Stage 4 → Stage 5(Sonnet 감지 + Kei 판단)
```
**Stage 5 역할 확장:**
1. **Sonnet이 감지**: 렌더링된 HTML + zone 예산 정보를 보고 넘침 여부 판단
2. **넘침이면 Kei에게 전달**: 실제 콘텐츠가 있는 상태에서 Kei가 판단
3. **Kei가 결정**: trim(텍스트 축약) 또는 restructure(팝업 분리)
4. **Sonnet이 실행**: CSS 조정 + 재렌더링
**Sonnet + Kei 협업 모델:**
```
Sonnet: "body zone이 520px인데 예산 490px. 30px 초과."
Kei: "꼭지 3의 부연 설명을 축약하면 됨. 핵심은 유지." (trim)
또는
Kei: "12행 비교표는 팝업으로 분리. 슬라이드엔 요약만." (restructure)
Sonnet: CSS 조정 + 재렌더링
```
---
### 방안 3: Stage 2 구조적 검증은 유지하되 역할 한정 (문제 2 해결)
Stage 2의 `_validate_height_budget()`**구조적 검증만** 담당:
- 금지 블록 교체 (BODY_FORBIDDEN_MAP) — 유지
- pill-pair 단독 금지 (I-7) — 유지
- 예상 높이 초과 — **경고만** (Kei 호출 안 함, Stage 5에서 처리)
```python
# Stage 2: 경고만 출력, overflow 정보는 Stage 5에서 활용
if total > budget:
logger.warning(f"[예상 높이 초과] {area}: {total}px > {budget}px (Stage 5에서 검증)")
# Kei 호출 안 함. 실제 렌더링 후 Stage 5에서 정확히 감지.
```
**Sonnet 프롬프트(STEP_B_PROMPT) 개선:**
- 현재: height_cost 매핑을 설명하지만 구체적 예시 없음
- 개선: 계산 예시 추가 + "초과 시 reason 필드에 설명" 명시
---
### 방안 4: 넘침을 Stage 5 재검토 루프에 통합 (문제 6 해결)
**현재 Stage 5 루프:**
```
재검토(Sonnet) → 조정(expand/shrink/rewrite) → 재편집(Kei 편집자) → 재렌더링 → 재검토
```
**개선 Stage 5 루프:**
```
재검토(Sonnet, 넘침 포함)
→ 넘침 있으면: Kei 판단(trim/restructure)
→ 조정 적용(expand/shrink/rewrite/trim/restructure)
→ 재편집(Kei 편집자) → 재렌더링 → 재검토
```
**Stage 5 프롬프트에 추가할 점검 항목:**
```
6. 높이 제약: 각 zone이 예산을 초과하는가?
- 자동 조정(shrink)으로 해결 가능 → shrink
- 불가능 → overflow_detected (Kei 판단 필요)
```
**_apply_adjustments()에 추가할 action:**
- `overflow_detected` → Kei API 호출 → trim/restructure 적용
---
## 해결 방안 매트릭스
| 방안 | 해결하는 문제 | 필요 기술 | 구현 난이도 |
|------|-------------|----------|------------|
| 1. 실제 높이 측정 | 문제 5 | Playwright 또는 Selenium | 중 (의존성 추가) |
| 2. 넘침 판단 Stage 5로 이동 | 문제 1, 2, 3, 4 | 코드 리팩토링 | 중 (Stage 2.5 제거, Stage 5 확장) |
| 3. Stage 2 경고만 | 문제 2 | 코드 수정 | 소 (Kei 호출 제거, 경고만) |
| 4. 넘침을 루프에 통합 | 문제 6 | Stage 5 프롬프트 + 코드 | 중 (새 action + Kei 연동) |
**방안 1은 선택적** — Playwright/Selenium 없이도 Sonnet이 HTML을 읽고 넘침을 추정할 수 있음. 정확도는 떨어지지만 현실적.
**방안 2+3+4는 필수** — 프로세스 구조 자체의 문제이므로 반드시 수정.
---
## 실행 계획: 프로세스 재설계 (방안 2+3+4)
> 충돌/회귀/오류 검토 완료. Phase I 산출물 전부 재사용. 변경 파일 `pipeline.py`만.
> Sonnet 신규 투입 0건. Kei API 호출 위치만 이동. 하드코딩/단발성 없음.
### 변경 전후 프로세스 비교
```
[변경 전]
Stage 1 → Stage 2 → [2.5 Kei 넘침 판단 ⚠️] → Stage 3 → Stage 4 → Stage 5(Sonnet만)
[변경 후]
Stage 1 → Stage 2(경고만) → Stage 3 → Stage 4 → Stage 5(Sonnet 감지 + Kei 판단)
```
### 변경 상세 (5건, pipeline.py만)
#### P-1: Stage 2.5 제거
**위치:** `pipeline.py` 91~136행 (46행)
**작업:** 전체 삭제
**영향:** 없음. overflow 키는 layout_concept에 남아 Stage 5에서 참고.
**Phase I 회귀 검토:**
- `call_kei_overflow_judgment()` — 함수 삭제 안 함. 호출 위치만 Stage 5로 이동.
- `_downgrade_fallback()` — 삭제 안 함. Stage 5에서 비상용.
- `KEI_OVERFLOW_PROMPT` — 삭제 안 함. Stage 5에서 사용.
---
#### P-2: `_review_balance()` 시그니처 + 프롬프트 확장
**위치:** `pipeline.py` 297~363행
**작업:**
1. 시그니처: `(html, layout_concept, content)``(html, layout_concept, content, analysis)` 추가
2. 프롬프트에 zone 예산 정보 + overflow 힌트 추가
3. 점검 항목 6번 추가: "높이 초과 — overflow_detected"
4. 출력 format에 `overflow_detected` action 추가
**변경 내용:**
```python
# 시그니처 변경
async def _review_balance(
html: str,
layout_concept: dict[str, Any],
content: str,
analysis: dict[str, Any], # 추가
) -> dict[str, Any] | None:
# 프롬프트 추가
# 1. zone 예산 정보 (select_preset + LAYOUT_PRESETS에서)
preset_name = select_preset(analysis)
preset = LAYOUT_PRESETS.get(preset_name, {})
zone_budget_lines = [
f"- {name}: ~{z['budget_px']}px (너비 {z['width_pct']}%)"
for name, z in preset.get("zones", {}).items()
]
# 2. Stage 2 예상 overflow 힌트 (있으면)
overflow_hint = layout_concept.get("overflow", [])
# 3. 점검 항목 6번
"6. 높이 초과: 각 zone의 블록+텍스트가 예산을 초과하는가?\n"
" - shrink로 해결 가능 → shrink\n"
" - 불가능 (콘텐츠가 본질적으로 큼) → overflow_detected\n"
# 4. action 추가
"- overflow_detected: 높이 초과로 Kei 판단 필요. 해당 zone과 초과 블록 명시.\n"
```
**충돌:** 기존 5개 점검 + 3개 action 변경 없음. 추가만.
**Sonnet 역할:** 넘침 **감지만**. 판단은 Kei.
---
#### P-3: Stage 5 루프에 Kei 넘침 판단 통합
**위치:** `pipeline.py` 155~180행
**작업:** 루프 내에서 overflow_detected 시 Kei 호출 추가
```python
for review_round in range(MAX_REVIEW_ROUNDS):
review_result = await _review_balance(html, layout_concept, content, analysis)
if not review_result or not review_result.get("needs_adjustment"):
break
# overflow_detected가 있으면 Kei에게 판단 요청
overflow_adjs = [
adj for adj in review_result.get("adjustments", [])
if adj.get("action") == "overflow_detected"
]
if overflow_adjs:
# 실제 콘텐츠가 있는 상태에서 Kei 판단
overflow_context = _build_overflow_context(layout_concept, overflow_adjs)
kei_judgment = await call_kei_overflow_judgment(
overflow_context, content, analysis
)
if kei_judgment is None:
logger.warning("[DOWNGRADE 비상] Kei API 실패")
for page in layout_concept.get("pages", []):
_downgrade_fallback(page.get("blocks", []), overflow_context)
else:
# Kei 판단을 adjustments에 반영 (overflow_detected → kei_trim/restructure)
_convert_kei_judgment(review_result, kei_judgment, analysis)
# 모든 조정 적용 (기존 expand/shrink/rewrite + 신규 kei_trim)
layout_concept = await _apply_adjustments(layout_concept, review_result, content)
html = render_slide(layout_concept)
```
**호출되는 함수:** 모두 Phase I에서 만든 것 재사용
- `call_kei_overflow_judgment()` — kei_client.py (변경 없음, Kei API만 사용)
- `_downgrade_fallback()` — design_director.py (변경 없음)
**신규 헬퍼 함수 2개:**
- `_build_overflow_context()` — overflow_adjs + layout_concept에서 실제 블록 데이터 추출
- `_convert_kei_judgment()` — Kei의 trim/restructure 결정을 review_result.adjustments에 반영
---
#### P-4: `_apply_adjustments()` — kei_trim action 추가
**위치:** `pipeline.py` 366~410행
**작업:** 기존 elif 체인에 kei_trim 분기 추가
```python
# 기존 expand/shrink/rewrite 로직 변경 없음
# 아래 elif만 추가:
elif action == "kei_trim":
max_chars = adj.get("max_chars", 200)
if "char_guide" not in block:
block["char_guide"] = {}
for key in block.get("char_guide", {}):
block["char_guide"][key] = min(block["char_guide"][key], max_chars)
if not block["char_guide"]:
block["char_guide"] = {"text": max_chars}
logger.info(f"조정: {area} → kei_trim max_chars={max_chars}")
elif action == "kei_restructure":
block["detail_target"] = True
if "data" in block:
del block["data"]
block["reason"] = f"재구성: {adj.get('detail', 'Kei 판단 팝업 분리')}"
logger.info(f"조정: {area} → kei_restructure (detail_target)")
```
**충돌:** 없음. 기존 3개 action 변경 0행. 새 elif 추가만.
---
#### P-5: 호출부 수정
**위치:** `pipeline.py` 156행
```python
# 현재:
review_result = await _review_balance(html, layout_concept, content)
# 변경:
review_result = await _review_balance(html, layout_concept, content, analysis)
```
**영향:** 이 함수의 호출부는 pipeline.py 156행 1곳만. 다른 파일에서 호출하지 않음.
---
### 변경 파일 총괄
| 파일 | 변경 | Phase I 코드 영향 |
|------|------|------------------|
| `pipeline.py` | Stage 2.5 제거 + Stage 5 확장 + 헬퍼 2개 + action 2개 | Phase I 함수 재사용, 삭제 0건 |
| `design_director.py` | **변경 없음** | — |
| `kei_client.py` | **변경 없음** | — |
| `content_editor.py` | **변경 없음** | — |
| `sse_utils.py` | **변경 없음** | — |
### 검증 매트릭스
| 항목 | 결과 |
|------|------|
| Phase I 회귀 | **없음** — I-1~I-14 전부 유지, 함수/상수 삭제 0건 |
| Kei API 사용 | **유지**`call_kei_overflow_judgment()` 호출 위치만 Stage 5로 이동 |
| Sonnet이 Kei 역할 대체 | **없음** — Sonnet은 감지만, 판단은 Kei만 |
| 하드코딩 | **없음** — trim max_chars는 Kei가 결정 |
| 단발성 수정 | **없음** — 범용 구조 (어떤 overflow에도 동작) |
| 기존 코드 충돌 | **없음** — overflow 키가 중간 단계에서 무시되는 것 확인 |
| DOWNGRADE 비상용 | **유지** — Stage 5에서 Kei 실패 시 동일하게 작동 |
### 실행 순서
1. P-1: Stage 2.5 제거 (pipeline.py 91~136행 삭제)
2. P-2: `_review_balance()` 시그니처 + 프롬프트 확장
3. P-3: Stage 5 루프에 Kei 연동 + 헬퍼 함수 2개
4. P-4: `_apply_adjustments()` kei_trim/kei_restructure action 추가
5. P-5: 호출부 `analysis` 파라미터 추가
---
## 이력
| 날짜 | 내용 |
|------|------|
| 2026-03-26 | Phase I 실행 완료 후 프로세스 검증 중 발견. 6개 문제 진단. |
| 2026-03-26 | 해결 방안 4개 조사. Playwright 높이 측정 + Stage 5 넘침 통합 방향 도출. |
| 2026-03-26 | **실행 계획 확정.** 충돌/회귀/오류 검토 완료. P-1~P-5 5건, pipeline.py만 변경. Phase I 산출물 전부 재사용. |