- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
- 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
- file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가
소요 시간: 10분 | Context: input 18k / output 2k tokens
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
1.1 KiB
1.1 KiB
소요 시간: 10분 Context 사용량: input 18k / output 2k tokens
작업 내용
96개 MD 파일을 하나로 병합하는 방법 설계 및 테스트 (06~08 페이지 3개). 이미지 파일명 충돌 문제를 해결하기 위해 페이지 번호 prefix를 붙여 단일 폴더로 통합하는 방식 채택.
변경 파일
merge_markdown.py: 전면 재작성 — 이미지 통합 폴더 생성, 파일명 rename, MD 내 경로 치환, file_range 파라미터 지원
주요 결정사항
- 이미지 rename 규칙:
{stem}_images/_page_0_Figure_3.jpeg→images/p006_Figure_3.jpeg_page_0_접두사 제거, 페이지 번호(zero-padded)를 prefix로
- 병합 파일은
output/안에 저장 → 상대경로images/그대로 유효 file_range파라미터로 테스트 범위 지정 가능
문제 및 해결
- 문제: 모든 MD가 단일 페이지이므로
_page_0_Figure_X이름이 96개 파일에서 중복 - 해결: 이미지를 단일
images/폴더로 복사할 때p{pagenum}_접두사 추가하여 고유명 보장