- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
- 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
- file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가
소요 시간: 10분 | Context: input 18k / output 2k tokens
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
1.1 KiB
1.1 KiB
documan 사용법
MD 파일 병합 (merge_markdown.py)
PDF에서 변환된 페이지별 MD 파일들을 하나의 파일로 합친다.
이미지도 output/images/ 폴더로 통합되고, MD 내 경로가 자동으로 업데이트된다.
전체 병합
python merge_markdown.py
- 입력:
output/MSWE3.0 Manual-01.md~output/MSWE3.0 Manual-96.md - 출력:
output/merged_all.md - 이미지:
output/images/p01_Figure_0.jpeg형식으로 통합
일부 페이지만 테스트
merge_markdown.py 하단의 __main__ 블록에서 file_range 지정:
merge_markdown_files(
input_dir="output",
output_file="merged_test.md",
images_subdir="images",
file_range=(6, 8), # 06~08 페이지만
)
이미지 이름 규칙
| 원본 | 변환 후 |
|---|---|
MSWE3.0 Manual-06_images/_page_0_Figure_0.jpeg |
images/p06_Figure_0.jpeg |
MSWE3.0 Manual-15_images/_page_0_Picture_12.jpeg |
images/p15_Picture_12.jpeg |
_page_0_접두사 제거- 페이지 번호를
p{NN}_형식으로 앞에 붙여 파일명 충돌 방지