All checks were successful
Publish ParaWiki / build-and-deploy (push) Successful in 29s
- PLAN.md · PROGRESS.md 도입: 병렬 에이전트 조정 지점 - CLAUDE.md 린화 + 에이전트 작업 흐름 섹션 (상세는 Output/guides/로 분리) - Output/guides/cimery-dev-guide.md, obsidian-cli.md 신설 - Agents: cimery-architect-researcher, adr-drafter - Commands: /plan, /progress, /adr, /research, /cimery-start - Skill: plan-commit - Hooks: raw/ 쓰기 차단, SessionStart PLAN/PROGRESS 주입, wiki/ADR 변경 시 log 갱신 알림, auto-approve (deny 훅 우선 유지) - .gitignore: .claude/ 공유 자산 포함, 로컬 상태·바이너리만 유지 제외 Closes #3 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
96 lines
4.0 KiB
Markdown
96 lines
4.0 KiB
Markdown
---
|
|
name: ingest-raw
|
|
description: Scan raw/ for sources not yet ingested and compile them into wiki/ pages per Karpathy LLM Wiki rules. Use when the user says "raw/ 인제스트", "raw 스캔 컴파일", "아직 인제스트 안 된 파일 처리", or "/ingest-raw". Updates wiki/index.md and wiki/log.md. Runs non-interactively and produces a final summary.
|
|
---
|
|
|
|
# ingest-raw
|
|
|
|
ParaWiki의 `raw/` 폴더를 스캔해서 아직 위키로 컴파일되지 않은 소스들을 `wiki/`에 반영한다. 대화 없이 바로 실행, 끝나면 요약만 보고.
|
|
|
|
## 입력
|
|
- 사용자 추가 인자 없이 바로 실행 가능. 사용자가 특정 파일을 지정하면 그 파일만 처리.
|
|
|
|
## 절차
|
|
|
|
### 1. 스캔
|
|
- `find raw -type f \( -name "*.md" -o -name "*.pdf" -o -name "*.txt" \) -not -name "README.md" -not -name "CLAUDE.md"` 로 raw/ 전체 파일 수집.
|
|
- 서브폴더: `ai-research/`, `papers/`, `standards/`, `tools/`, `notes/` (있는 것만).
|
|
|
|
### 2. 이미 인제스트된 소스 판별
|
|
- `wiki/log.md` 를 읽고 기록된 소스 파일 경로를 수집.
|
|
- 그리고 `wiki/*.md` 파일들의 frontmatter `sources:` 필드 전체를 스캔해 교차 검증.
|
|
- **아직 인제스트 안 된 파일** = raw 스캔 결과에서 위 두 집합을 뺀 것.
|
|
|
|
### 3. 컴파일 결정
|
|
- 신규 파일이 없으면: "새 파일 없음"을 요약하고 종료.
|
|
- 신규 파일이 있으면 각각에 대해:
|
|
- 내용을 읽고 **핵심 개념**을 추출.
|
|
- **Rule 9 우선:** 기존 wiki 페이지(`wiki/*.md`)가 같은 주제를 이미 다룬다면 **업데이트 우선**. 새 페이지는 기존이 없을 때만.
|
|
- 한 소스가 여러 개념을 담고 있으면 여러 페이지에 쪼개 반영할 수 있음. 단, 과도한 페이지 양산 금지 (한 소스당 **최대 3~4개** 페이지 권장).
|
|
|
|
### 4. 위키 페이지 작성/갱신 — Karpathy 10대 규칙 준수
|
|
모든 신규/갱신 페이지 상단은 YAML frontmatter:
|
|
|
|
```yaml
|
|
---
|
|
title: 페이지 제목
|
|
tags: [...]
|
|
sources:
|
|
- raw/.../원본파일.md
|
|
updated: YYYY-MM-DD
|
|
principles: [비패밀리|증분|선형-GIS] # 해당 시만
|
|
---
|
|
```
|
|
|
|
본문 구성(권장):
|
|
1. **요약** (1~3문장)
|
|
2. **사실 (Facts)** — 원문의 사실만. 해석 금지. 필요 시 표·리스트.
|
|
3. **해석 (Interpretation)** — 우리 프로젝트 관점. 잠정 설계 원칙과의 연결을 여기서.
|
|
4. **관련 페이지** — `[[...]]` wikilink.
|
|
|
|
규칙 체크리스트:
|
|
- [ ] 내부 참조는 **wikilink** 형식.
|
|
- [ ] **사실과 해석 분리.**
|
|
- [ ] 모순 소스는 **양쪽 모두 인용.**
|
|
- [ ] 기존 페이지 업데이트를 새 페이지보다 우선.
|
|
|
|
### 5. index.md 갱신
|
|
- 신규 페이지는 해당 카테고리 아래 **한 줄, 120자 이내** 추가:
|
|
`- [[페이지명]] — 핵심 한 줄 설명.`
|
|
- 카테고리: 설계 원칙 허브 / 개념 / 도메인: 교량 / 기하·수학 / 도구·엔진 / 표준·스펙. 맞는 곳이 없으면 "개념" 아래.
|
|
- 페이지 삭제·병합·이름 변경 시도 해당 줄을 동일하게 갱신.
|
|
|
|
### 6. log.md 갱신
|
|
- **시간 역순(최신이 위).** 형식:
|
|
`- YYYY-MM-DD [action] [[페이지명]] — 한 줄 설명`
|
|
- 액션: `create` / `update` / `delete` / `rename` / `merge` / `meta`.
|
|
- 원칙 연결이 있으면 설명 끝에 "원칙: X,Y" 명시.
|
|
|
|
### 7. 최종 요약 보고
|
|
보고 형식:
|
|
```
|
|
## 요약
|
|
|
|
**인제스트 신규 소스 N건**:
|
|
- <경로1>
|
|
- <경로2>
|
|
|
|
**위키 변경**:
|
|
- 신규: [[A]], [[B]]
|
|
- 갱신: [[C]]
|
|
|
|
**원칙 연결**:
|
|
- 비패밀리: ...
|
|
- 증분: ...
|
|
- 선형-GIS: ...
|
|
|
|
**미커버 원칙**: 원칙 중 이번에도 소스가 없어 비어 있는 축.
|
|
```
|
|
|
|
## 주의사항
|
|
- `raw/` 는 **절대 수정·삭제 금지** (불변 원본).
|
|
- 실행 중 사용자와 대화하지 말고 끝난 뒤 요약만.
|
|
- 문서 분량이 커 한 번에 읽기 어려우면 offset/limit으로 분할 읽기.
|
|
- 소스 2건 이상이 같은 주제를 다루면 같은 페이지에 합쳐 `sources:` 배열에 모두 포함.
|
|
- 소스 간 **모순**이 있으면 사실 섹션에서 양쪽 모두 인용하고 차이 기록.
|