Files
documan/docs/history/2026-04-01_MD파일병합및이미지경로통합.md
minsung 8d4339302e feat: MD 파일 병합 및 이미지 경로 통합 스크립트 추가 (#1)
- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
  - 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
  - file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가

소요 시간: 10분 | Context: input 18k / output 2k tokens

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-01 11:00:28 +09:00

1.1 KiB

소요 시간: 10분 Context 사용량: input 18k / output 2k tokens

작업 내용

96개 MD 파일을 하나로 병합하는 방법 설계 및 테스트 (06~08 페이지 3개). 이미지 파일명 충돌 문제를 해결하기 위해 페이지 번호 prefix를 붙여 단일 폴더로 통합하는 방식 채택.

변경 파일

  • merge_markdown.py : 전면 재작성 — 이미지 통합 폴더 생성, 파일명 rename, MD 내 경로 치환, file_range 파라미터 지원

주요 결정사항

  • 이미지 rename 규칙: {stem}_images/_page_0_Figure_3.jpegimages/p006_Figure_3.jpeg
    • _page_0_ 접두사 제거, 페이지 번호(zero-padded)를 prefix로
  • 병합 파일은 output/ 안에 저장 → 상대경로 images/ 그대로 유효
  • file_range 파라미터로 테스트 범위 지정 가능

문제 및 해결

  • 문제: 모든 MD가 단일 페이지이므로 _page_0_Figure_X 이름이 96개 파일에서 중복
  • 해결: 이미지를 단일 images/ 폴더로 복사할 때 p{pagenum}_ 접두사 추가하여 고유명 보장