Update wiki page 'Step 04'
34
Step-04.md
34
Step-04.md
@@ -1,26 +1,18 @@
|
|||||||
# Step 04. 블록 해체 및 분류 (Block Decomposition)
|
# Step 04. 프롬프트 및 도메인 사항 추출 (Extraction)
|
||||||
|
|
||||||
## 1. 목적 (Objective)
|
## 1. 목적 (Objective)
|
||||||
파일 전체가 아닌 블록 단위로 해체하여 Judge-Standard 기준으로 각 블록의 성격을 판단함.
|
선택된 파일 본문에서 AI 행동을 제어하는 로직(Prompt)과 그 바탕이 되는 전문 지식(Domain)을 훼손 없이 적출함.
|
||||||
|
|
||||||
## 2. 파일 유형별 해체 방식 (Methodology)
|
## 2. 수행방법 (Methodology)
|
||||||
### .txt / .md 파일
|
1. 파일 유형별 최적화된 추출 엔진 가동:
|
||||||
- 전체 내용을 읽고 섹션(##) 단위로 분리하여 개별 판단.
|
- **.py:** AST 파싱을 통해 prompt 변수 및 Docstring 추출.
|
||||||
- CSS/HTML/JS 블록이 섞여있으면 별도 추출.
|
- **.md / .txt:** 헤더(###) 및 문맥 변곡점을 기준으로 지시문과 데이터 분리.
|
||||||
### .py 파일
|
- **.json:** 재귀 탐색함.
|
||||||
- 멀티라인 문자열 변수(\"\"\"...\"\"\") 및 PROMPT_ 등 관련 변수값 추출.
|
2. **수술적 분리 원칙:** 지시문과 데이터가 섞여 있을 경우, 원본 텍스트의 변조 없이 물리적 블록으로 각각 나누어 추출함.
|
||||||
- def/class 단위로 분리하여 코드도메인 여부 판단.
|
|
||||||
### .json / .yaml 파일
|
|
||||||
- system, prompt, messages 키의 값을 프롬프트 후보로 추출.
|
|
||||||
|
|
||||||
## 3. 판단 시 주의사항 (Precautions)
|
## 3. 결과 및 분기 (Success/Failure)
|
||||||
- AI 지시멸 여부: Judge-Standard 3요소(행동 지시, 가변 블록 등) 충족 확인.
|
- **성공 시**: 추출된 블록 리스트를 이슈 #46에 보고하고 'Step 05 이동' 선언.
|
||||||
- 제외 대상: API 호출 코드, 한 줄짜리 인라인 문자열 등은 제외.
|
- **실패 시**: 추출 결과가 빈약하거나 무의미할 경우 분석 로직 수정 후 Step 04 재수행.
|
||||||
|
|
||||||
## 4. 결과 및 분기 (Success/Failure)
|
## 4. 통과 기준 (Success Criteria)
|
||||||
- **성공 시**: 분류 근거가 담긴 [표준 대조표] 작성 후 이슈 #46에 승인 요청.
|
- 원본 텍스트 무결성 보존 및 로직/데이터의 의미적 분리 완료.
|
||||||
- **실패 시**: 오판 발견 시 즉시 분류 로직 수정 후 Step 04 재실행.
|
|
||||||
|
|
||||||
## 5. 통과 기준 (Success Criteria)
|
|
||||||
- 파일 전체 복사 0건 (반드시 블록 추출).
|
|
||||||
- API 코드 등 불필요 데이터 혼입 0건.
|
|
||||||
Reference in New Issue
Block a user