Update wiki page 'Step 01'

2026-03-09 14:40:52 +09:00
parent 0e4372fd43
commit bc51e6268e

@@ -1,22 +1,29 @@
# Step 01. 파일 수집 (Source Discovery) # Step 01. 정리 대상 폴더 스크린 (Screening)
## 1. 목적 (Objective) ## 1. 목적 (Objective)
지정 3대 검토 대상 경로에서 프롬프트와 지식 원천이 될 수 있는 모든 소스 파일을 누락 없이 목록화함. 사용자님이 지정 3대 핵심 경로에서 프롬프트와 도메인 지식 원천이 될 수 있는 소스 파일을 누락 없이 식별하여 목록화함.
## 2. 검토 대상 경로 (Source Paths - FIXED) ## 2. 검토 대상 경로 (Source Paths - FIXED)
오직 아래 경로만을 대상으로 함: 오직 아래의 3개 경로만을 절대적 분석 타겟으로 고정함 (이 외의 경로는 무시):
- D:\crawling - D:\crawling
- D:\for python - D:\for python
- D:\MYCLAUDE_PROJECT - D:\MYCLAUDE_PROJECT
## 3. 수행방법 (Methodology) ## 3. 수행방법 (Methodology)
1. run_shell_command를 통해 지정된 3개 경로를 재귀 탐색. 1. `run_shell_command`를 사용하여 위 3개 고정 경로를 재귀적으로 탐색.
2. 유효 확장자(.py, .txt, .md, .js, .json, .docx, .xlsx, .pdf, .hwp) 전수 식별. 2. 아래의 유효 확장자를 가진 파일을 전수 식별함:
3. 수집된 메타데이터를 filelist.csv에 저장. - **코드/텍스트:** .py, .js, .ts, .html, .css, .json, .yaml, .txt, .md
- **문서/데이터:** .pdf, .hwp, .hwpx, .docx, .pptx, .xlsx
3. 시스템/라이브러리 폴더(.git, node_modules 등)를 제외한 메타데이터를 `filelist.csv`에 저장함.
4. Gitea 이슈 #46에 [현황/반영현황/변경현황] 구조로 수집 결과를 코멘트함.
## 4. 결과 및 분기 (Success/Failure) ## 4. 결과 및 분기 (Execution Branch)
- **성공 시**: filelist.csv 생성 확인 후 이슈 #46에 확장자 통계 보고 및 'Step 02 이동' 선언. - **성공 시 (Success)**:
- **실패 시**: 경로 접근 불가 등 오류 발생 시 이슈 #46 기록 후 즉시 중단. - `filelist.csv` 생성 확인 및 확장자별 통계 요약 보고.
- 이슈 #46에 "**=> 결과: 통과 / Step 02로 이동**" 코멘트 등록 후 진입.
- **실패 시 (Failure)**:
- 경로 접근 불가나 유효 파일 부재 시 즉시 중단.
- 오류 원인을 이슈 #46에 기록하고 해결 후 Step 01을 처음부터 재수행함.
## 5. 통과 기준 (Success Criteria) ## 5. 통과 기준 (Success Criteria)
- filelist.csv 생성 및 이슈 #46 보고 완료. - 3대 고정 경로의 파일이 누락 없이 `filelist.csv`에 담기고 이슈 #46 보고 완료.