feat: MD 파일 병합 및 이미지 경로 통합 스크립트 추가 (#1)

- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
  - 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
  - file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가

소요 시간: 10분 | Context: input 18k / output 2k tokens

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
minsung
2026-04-01 11:00:28 +09:00
parent 892e4ecafb
commit 8d4339302e
24 changed files with 2335 additions and 0 deletions

View File

@@ -0,0 +1,19 @@
**소요 시간**: 10분
**Context 사용량**: input 18k / output 2k tokens
## 작업 내용
96개 MD 파일을 하나로 병합하는 방법 설계 및 테스트 (06~08 페이지 3개).
이미지 파일명 충돌 문제를 해결하기 위해 페이지 번호 prefix를 붙여 단일 폴더로 통합하는 방식 채택.
## 변경 파일
- `merge_markdown.py` : 전면 재작성 — 이미지 통합 폴더 생성, 파일명 rename, MD 내 경로 치환, file_range 파라미터 지원
## 주요 결정사항
- 이미지 rename 규칙: `{stem}_images/_page_0_Figure_3.jpeg``images/p006_Figure_3.jpeg`
- `_page_0_` 접두사 제거, 페이지 번호(zero-padded)를 prefix로
- 병합 파일은 `output/` 안에 저장 → 상대경로 `images/` 그대로 유효
- `file_range` 파라미터로 테스트 범위 지정 가능
## 문제 및 해결
- 문제: 모든 MD가 단일 페이지이므로 `_page_0_Figure_X` 이름이 96개 파일에서 중복
- 해결: 이미지를 단일 `images/` 폴더로 복사할 때 `p{pagenum}_` 접두사 추가하여 고유명 보장