Update wiki page 'Step 04'

2026-03-09 14:51:00 +09:00
parent db65b8a5e4
commit c6d7ecb44b

@@ -1,26 +1,18 @@
# Step 04. 블록 해체 및 분류 (Block Decomposition) # Step 04. 프롬프트 및 도메인 사항 추출 (Extraction)
## 1. 목적 (Objective) ## 1. 목적 (Objective)
파일 전체가 아닌 블록 단위로 해체하여 Judge-Standard 기준으로 각 블록의 성격을 판단함. 선택된 파일 본문에서 AI 행동을 제어하는 로직(Prompt)과 그 바탕이 되는 전문 지식(Domain)을 훼손 없이 적출함.
## 2. 파일 유형별 해체 방식 (Methodology) ## 2. 수행방법 (Methodology)
### .txt / .md 파일 1. 파일 유형별 최적화된 추출 엔진 가동:
- 전체 내용을 읽고 섹션(##) 단위로 분리하여 개별 판단. - **.py:** AST 파싱을 통해 prompt 변수 및 Docstring 추출.
- CSS/HTML/JS 블록이 섞여있으면 별도 추출. - **.md / .txt:** 헤더(###) 및 문맥 변곡점을 기준으로 지시문과 데이터 분리.
### .py 파일 - **.json:** 재귀 탐색함.
- 멀티라인 문자열 변수(\"\"\"...\"\"\") 및 PROMPT_ 등 관련 변수값 추출. 2. **수술적 분리 원칙:** 지시문과 데이터가 섞여 있을 경우, 원본 텍스트의 변조 없이 물리적 블록으로 각각 나누어 추출.
- def/class 단위로 분리하여 코드도메인 여부 판단.
### .json / .yaml 파일
- system, prompt, messages 키의 값을 프롬프트 후보로 추출.
## 3. 판단 시 주의사항 (Precautions) ## 3. 결과 및 분기 (Success/Failure)
- AI 지시멸 여부: Judge-Standard 3요소(행동 지시, 가변 블록 등) 충족 확인. - **성공 시**: 추출된 블록 리스트를 이슈 #46에 보고하고 'Step 05 이동' 선언.
- 제외 대상: API 호출 코드, 한 줄짜리 인라인 문자열 등은 제외. - **실패 시**: 추출 결과가 빈약하거나 무의미할 경우 분석 로직 수정 후 Step 04 재수행.
## 4. 및 분기 (Success/Failure) ## 4. 과 기 (Success Criteria)
- **성공 시**: 분류 근거가 담긴 [표준 대조표] 작성 후 이슈 #46에 승인 요청. - 원본 텍스트 무결성 보존 및 로직/데이터의 의미적 분리 완료.
- **실패 시**: 오판 발견 시 즉시 분류 로직 수정 후 Step 04 재실행.
## 5. 통과 기준 (Success Criteria)
- 파일 전체 복사 0건 (반드시 블록 추출).
- API 코드 등 불필요 데이터 혼입 0건.