From c6d7ecb44be9f3e51f7dcb5d415ca65c65df41c1 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=EC=9D=B4=EA=B2=BD=EB=AF=BC?= Date: Mon, 9 Mar 2026 14:51:00 +0900 Subject: [PATCH] Update wiki page 'Step 04' --- Step-04.md | 34 +++++++++++++--------------------- 1 file changed, 13 insertions(+), 21 deletions(-) diff --git a/Step-04.md b/Step-04.md index 6e3548d..0d6600f 100644 --- a/Step-04.md +++ b/Step-04.md @@ -1,26 +1,18 @@ -# Step 04. 블록 해체 및 분류 (Block Decomposition) +# Step 04. 프롬프트 및 도메인 사항 추출 (Extraction) ## 1. 목적 (Objective) -파일 전체가 아닌 블록 단위로 해체하여 Judge-Standard 기준으로 각 블록의 성격을 판단함. +선택된 파일 본문에서 AI 행동을 제어하는 로직(Prompt)과 그 바탕이 되는 전문 지식(Domain)을 훼손 없이 적출함. -## 2. 파일 유형별 해체 방식 (Methodology) -### .txt / .md 파일 -- 전체 내용을 읽고 섹션(##) 단위로 분리하여 개별 판단. -- CSS/HTML/JS 블록이 섞여있으면 별도 추출. -### .py 파일 -- 멀티라인 문자열 변수(\"\"\"...\"\"\") 및 PROMPT_ 등 관련 변수값 추출. -- def/class 단위로 분리하여 코드도메인 여부 판단. -### .json / .yaml 파일 -- system, prompt, messages 키의 값을 프롬프트 후보로 추출. +## 2. 수행방법 (Methodology) +1. 파일 유형별 최적화된 추출 엔진 가동: + - **.py:** AST 파싱을 통해 prompt 변수 및 Docstring 추출. + - **.md / .txt:** 헤더(###) 및 문맥 변곡점을 기준으로 지시문과 데이터 분리. + - **.json:** 재귀 탐색함. +2. **수술적 분리 원칙:** 지시문과 데이터가 섞여 있을 경우, 원본 텍스트의 변조 없이 물리적 블록으로 각각 나누어 추출함. -## 3. 판단 시 주의사항 (Precautions) -- AI 지시멸 여부: Judge-Standard 3요소(행동 지시, 가변 블록 등) 충족 확인. -- 제외 대상: API 호출 코드, 한 줄짜리 인라인 문자열 등은 제외. +## 3. 결과 및 분기 (Success/Failure) +- **성공 시**: 추출된 블록 리스트를 이슈 #46에 보고하고 'Step 05 이동' 선언. +- **실패 시**: 추출 결과가 빈약하거나 무의미할 경우 분석 로직 수정 후 Step 04 재수행. -## 4. 결과 및 분기 (Success/Failure) -- **성공 시**: 분류 근거가 담긴 [표준 대조표] 작성 후 이슈 #46에 승인 요청. -- **실패 시**: 오판 발견 시 즉시 분류 로직 수정 후 Step 04 재실행. - -## 5. 통과 기준 (Success Criteria) -- 파일 전체 복사 0건 (반드시 블록 추출). -- API 코드 등 불필요 데이터 혼입 0건. \ No newline at end of file +## 4. 통과 기준 (Success Criteria) +- 원본 텍스트 무결성 보존 및 로직/데이터의 의미적 분리 완료. \ No newline at end of file