Files
documan/docs/tutorial.md
minsung 8d4339302e feat: MD 파일 병합 및 이미지 경로 통합 스크립트 추가 (#1)
- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
  - 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
  - file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가

소요 시간: 10분 | Context: input 18k / output 2k tokens

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-01 11:00:28 +09:00

40 lines
1.1 KiB
Markdown

# documan 사용법
## MD 파일 병합 (merge_markdown.py)
PDF에서 변환된 페이지별 MD 파일들을 하나의 파일로 합친다.
이미지도 `output/images/` 폴더로 통합되고, MD 내 경로가 자동으로 업데이트된다.
### 전체 병합
```bash
python merge_markdown.py
```
- 입력: `output/MSWE3.0 Manual-01.md` ~ `output/MSWE3.0 Manual-96.md`
- 출력: `output/merged_all.md`
- 이미지: `output/images/p01_Figure_0.jpeg` 형식으로 통합
### 일부 페이지만 테스트
`merge_markdown.py` 하단의 `__main__` 블록에서 `file_range` 지정:
```python
merge_markdown_files(
input_dir="output",
output_file="merged_test.md",
images_subdir="images",
file_range=(6, 8), # 06~08 페이지만
)
```
### 이미지 이름 규칙
| 원본 | 변환 후 |
|------|---------|
| `MSWE3.0 Manual-06_images/_page_0_Figure_0.jpeg` | `images/p06_Figure_0.jpeg` |
| `MSWE3.0 Manual-15_images/_page_0_Picture_12.jpeg` | `images/p15_Picture_12.jpeg` |
- `_page_0_` 접두사 제거
- 페이지 번호를 `p{NN}_` 형식으로 앞에 붙여 파일명 충돌 방지