Files
ParaWiki/.claude/skills/ingest-raw/SKILL.md
minsung 3bd01e31c9
All checks were successful
Publish ParaWiki / build-and-deploy (push) Successful in 29s
에이전트 협업 인프라 구축 — .claude/ 확장
- PLAN.md · PROGRESS.md 도입: 병렬 에이전트 조정 지점
- CLAUDE.md 린화 + 에이전트 작업 흐름 섹션 (상세는 Output/guides/로 분리)
- Output/guides/cimery-dev-guide.md, obsidian-cli.md 신설
- Agents: cimery-architect-researcher, adr-drafter
- Commands: /plan, /progress, /adr, /research, /cimery-start
- Skill: plan-commit
- Hooks: raw/ 쓰기 차단, SessionStart PLAN/PROGRESS 주입,
  wiki/ADR 변경 시 log 갱신 알림, auto-approve (deny 훅 우선 유지)
- .gitignore: .claude/ 공유 자산 포함, 로컬 상태·바이너리만 유지 제외

Closes #3

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-14 17:21:11 +09:00

4.0 KiB

name, description
name description
ingest-raw Scan raw/ for sources not yet ingested and compile them into wiki/ pages per Karpathy LLM Wiki rules. Use when the user says "raw/ 인제스트", "raw 스캔 컴파일", "아직 인제스트 안 된 파일 처리", or "/ingest-raw". Updates wiki/index.md and wiki/log.md. Runs non-interactively and produces a final summary.

ingest-raw

ParaWiki의 raw/ 폴더를 스캔해서 아직 위키로 컴파일되지 않은 소스들을 wiki/에 반영한다. 대화 없이 바로 실행, 끝나면 요약만 보고.

입력

  • 사용자 추가 인자 없이 바로 실행 가능. 사용자가 특정 파일을 지정하면 그 파일만 처리.

절차

1. 스캔

  • find raw -type f \( -name "*.md" -o -name "*.pdf" -o -name "*.txt" \) -not -name "README.md" -not -name "CLAUDE.md" 로 raw/ 전체 파일 수집.
  • 서브폴더: ai-research/, papers/, standards/, tools/, notes/ (있는 것만).

2. 이미 인제스트된 소스 판별

  • wiki/log.md 를 읽고 기록된 소스 파일 경로를 수집.
  • 그리고 wiki/*.md 파일들의 frontmatter sources: 필드 전체를 스캔해 교차 검증.
  • 아직 인제스트 안 된 파일 = raw 스캔 결과에서 위 두 집합을 뺀 것.

3. 컴파일 결정

  • 신규 파일이 없으면: "새 파일 없음"을 요약하고 종료.
  • 신규 파일이 있으면 각각에 대해:
    • 내용을 읽고 핵심 개념을 추출.
    • Rule 9 우선: 기존 wiki 페이지(wiki/*.md)가 같은 주제를 이미 다룬다면 업데이트 우선. 새 페이지는 기존이 없을 때만.
    • 한 소스가 여러 개념을 담고 있으면 여러 페이지에 쪼개 반영할 수 있음. 단, 과도한 페이지 양산 금지 (한 소스당 최대 3~4개 페이지 권장).

4. 위키 페이지 작성/갱신 — Karpathy 10대 규칙 준수

모든 신규/갱신 페이지 상단은 YAML frontmatter:

---
title: 페이지 제목
tags: [...]
sources:
  - raw/.../원본파일.md
updated: YYYY-MM-DD
principles: [비패밀리|증분|선형-GIS]  # 해당 시만
---

본문 구성(권장):

  1. 요약 (1~3문장)
  2. 사실 (Facts) — 원문의 사실만. 해석 금지. 필요 시 표·리스트.
  3. 해석 (Interpretation) — 우리 프로젝트 관점. 잠정 설계 원칙과의 연결을 여기서.
  4. 관련 페이지[[...]] wikilink.

규칙 체크리스트:

  • 내부 참조는 wikilink 형식.
  • 사실과 해석 분리.
  • 모순 소스는 양쪽 모두 인용.
  • 기존 페이지 업데이트를 새 페이지보다 우선.

5. index.md 갱신

  • 신규 페이지는 해당 카테고리 아래 한 줄, 120자 이내 추가: - [[페이지명]] — 핵심 한 줄 설명.
  • 카테고리: 설계 원칙 허브 / 개념 / 도메인: 교량 / 기하·수학 / 도구·엔진 / 표준·스펙. 맞는 곳이 없으면 "개념" 아래.
  • 페이지 삭제·병합·이름 변경 시도 해당 줄을 동일하게 갱신.

6. log.md 갱신

  • 시간 역순(최신이 위). 형식: - YYYY-MM-DD [action] [[페이지명]] — 한 줄 설명
  • 액션: create / update / delete / rename / merge / meta.
  • 원칙 연결이 있으면 설명 끝에 "원칙: X,Y" 명시.

7. 최종 요약 보고

보고 형식:

## 요약

**인제스트 신규 소스 N건**:
- <경로1>
- <경로2>

**위키 변경**:
- 신규: [[A]], [[B]]
- 갱신: [[C]]

**원칙 연결**:
- 비패밀리: ...
- 증분: ...
- 선형-GIS: ...

**미커버 원칙**: 원칙 중 이번에도 소스가 없어 비어 있는 축.

주의사항

  • raw/절대 수정·삭제 금지 (불변 원본).
  • 실행 중 사용자와 대화하지 말고 끝난 뒤 요약만.
  • 문서 분량이 커 한 번에 읽기 어려우면 offset/limit으로 분할 읽기.
  • 소스 2건 이상이 같은 주제를 다루면 같은 페이지에 합쳐 sources: 배열에 모두 포함.
  • 소스 간 모순이 있으면 사실 섹션에서 양쪽 모두 인용하고 차이 기록.