--- name: ingest-raw description: Scan raw/ for sources not yet ingested and compile them into wiki/ pages per Karpathy LLM Wiki rules. Use when the user says "raw/ 인제스트", "raw 스캔 컴파일", "아직 인제스트 안 된 파일 처리", or "/ingest-raw". Updates wiki/index.md and wiki/log.md. Runs non-interactively and produces a final summary. --- # ingest-raw ParaWiki의 `raw/` 폴더를 스캔해서 아직 위키로 컴파일되지 않은 소스들을 `wiki/`에 반영한다. 대화 없이 바로 실행, 끝나면 요약만 보고. ## 입력 - 사용자 추가 인자 없이 바로 실행 가능. 사용자가 특정 파일을 지정하면 그 파일만 처리. ## 절차 ### 1. 스캔 - `find raw -type f \( -name "*.md" -o -name "*.pdf" -o -name "*.txt" \) -not -name "README.md" -not -name "CLAUDE.md"` 로 raw/ 전체 파일 수집. - 서브폴더: `ai-research/`, `papers/`, `standards/`, `tools/`, `notes/` (있는 것만). ### 2. 이미 인제스트된 소스 판별 - `wiki/log.md` 를 읽고 기록된 소스 파일 경로를 수집. - 그리고 `wiki/*.md` 파일들의 frontmatter `sources:` 필드 전체를 스캔해 교차 검증. - **아직 인제스트 안 된 파일** = raw 스캔 결과에서 위 두 집합을 뺀 것. ### 3. 컴파일 결정 - 신규 파일이 없으면: "새 파일 없음"을 요약하고 종료. - 신규 파일이 있으면 각각에 대해: - 내용을 읽고 **핵심 개념**을 추출. - **Rule 9 우선:** 기존 wiki 페이지(`wiki/*.md`)가 같은 주제를 이미 다룬다면 **업데이트 우선**. 새 페이지는 기존이 없을 때만. - 한 소스가 여러 개념을 담고 있으면 여러 페이지에 쪼개 반영할 수 있음. 단, 과도한 페이지 양산 금지 (한 소스당 **최대 3~4개** 페이지 권장). ### 4. 위키 페이지 작성/갱신 — Karpathy 10대 규칙 준수 모든 신규/갱신 페이지 상단은 YAML frontmatter: ```yaml --- title: 페이지 제목 tags: [...] sources: - raw/.../원본파일.md updated: YYYY-MM-DD principles: [비패밀리|증분|선형-GIS] # 해당 시만 --- ``` 본문 구성(권장): 1. **요약** (1~3문장) 2. **사실 (Facts)** — 원문의 사실만. 해석 금지. 필요 시 표·리스트. 3. **해석 (Interpretation)** — 우리 프로젝트 관점. 잠정 설계 원칙과의 연결을 여기서. 4. **관련 페이지** — `[[...]]` wikilink. 규칙 체크리스트: - [ ] 내부 참조는 **wikilink** 형식. - [ ] **사실과 해석 분리.** - [ ] 모순 소스는 **양쪽 모두 인용.** - [ ] 기존 페이지 업데이트를 새 페이지보다 우선. ### 5. index.md 갱신 - 신규 페이지는 해당 카테고리 아래 **한 줄, 120자 이내** 추가: `- [[페이지명]] — 핵심 한 줄 설명.` - 카테고리: 설계 원칙 허브 / 개념 / 도메인: 교량 / 기하·수학 / 도구·엔진 / 표준·스펙. 맞는 곳이 없으면 "개념" 아래. - 페이지 삭제·병합·이름 변경 시도 해당 줄을 동일하게 갱신. ### 6. log.md 갱신 - **시간 역순(최신이 위).** 형식: `- YYYY-MM-DD [action] [[페이지명]] — 한 줄 설명` - 액션: `create` / `update` / `delete` / `rename` / `merge` / `meta`. - 원칙 연결이 있으면 설명 끝에 "원칙: X,Y" 명시. ### 7. 최종 요약 보고 보고 형식: ``` ## 요약 **인제스트 신규 소스 N건**: - <경로1> - <경로2> **위키 변경**: - 신규: [[A]], [[B]] - 갱신: [[C]] **원칙 연결**: - 비패밀리: ... - 증분: ... - 선형-GIS: ... **미커버 원칙**: 원칙 중 이번에도 소스가 없어 비어 있는 축. ``` ## 주의사항 - `raw/` 는 **절대 수정·삭제 금지** (불변 원본). - 실행 중 사용자와 대화하지 말고 끝난 뒤 요약만. - 문서 분량이 커 한 번에 읽기 어려우면 offset/limit으로 분할 읽기. - 소스 2건 이상이 같은 주제를 다루면 같은 페이지에 합쳐 `sources:` 배열에 모두 포함. - 소스 간 **모순**이 있으면 사실 섹션에서 양쪽 모두 인용하고 차이 기록.