Files
documan/docs/tutorial.md
minsung 8d4339302e feat: MD 파일 병합 및 이미지 경로 통합 스크립트 추가 (#1)
- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
  - 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
  - file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가

소요 시간: 10분 | Context: input 18k / output 2k tokens

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-01 11:00:28 +09:00

1.1 KiB

documan 사용법

MD 파일 병합 (merge_markdown.py)

PDF에서 변환된 페이지별 MD 파일들을 하나의 파일로 합친다. 이미지도 output/images/ 폴더로 통합되고, MD 내 경로가 자동으로 업데이트된다.

전체 병합

python merge_markdown.py
  • 입력: output/MSWE3.0 Manual-01.md ~ output/MSWE3.0 Manual-96.md
  • 출력: output/merged_all.md
  • 이미지: output/images/p01_Figure_0.jpeg 형식으로 통합

일부 페이지만 테스트

merge_markdown.py 하단의 __main__ 블록에서 file_range 지정:

merge_markdown_files(
    input_dir="output",
    output_file="merged_test.md",
    images_subdir="images",
    file_range=(6, 8),   # 06~08 페이지만
)

이미지 이름 규칙

원본 변환 후
MSWE3.0 Manual-06_images/_page_0_Figure_0.jpeg images/p06_Figure_0.jpeg
MSWE3.0 Manual-15_images/_page_0_Picture_12.jpeg images/p15_Picture_12.jpeg
  • _page_0_ 접두사 제거
  • 페이지 번호를 p{NN}_ 형식으로 앞에 붙여 파일명 충돌 방지