feat: MD 파일 병합 및 이미지 경로 통합 스크립트 추가 (#1)
- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
- 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
- file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가
소요 시간: 10분 | Context: input 18k / output 2k tokens
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
39
docs/tutorial.md
Normal file
39
docs/tutorial.md
Normal file
@@ -0,0 +1,39 @@
|
||||
# documan 사용법
|
||||
|
||||
## MD 파일 병합 (merge_markdown.py)
|
||||
|
||||
PDF에서 변환된 페이지별 MD 파일들을 하나의 파일로 합친다.
|
||||
이미지도 `output/images/` 폴더로 통합되고, MD 내 경로가 자동으로 업데이트된다.
|
||||
|
||||
### 전체 병합
|
||||
|
||||
```bash
|
||||
python merge_markdown.py
|
||||
```
|
||||
|
||||
- 입력: `output/MSWE3.0 Manual-01.md` ~ `output/MSWE3.0 Manual-96.md`
|
||||
- 출력: `output/merged_all.md`
|
||||
- 이미지: `output/images/p01_Figure_0.jpeg` 형식으로 통합
|
||||
|
||||
### 일부 페이지만 테스트
|
||||
|
||||
`merge_markdown.py` 하단의 `__main__` 블록에서 `file_range` 지정:
|
||||
|
||||
```python
|
||||
merge_markdown_files(
|
||||
input_dir="output",
|
||||
output_file="merged_test.md",
|
||||
images_subdir="images",
|
||||
file_range=(6, 8), # 06~08 페이지만
|
||||
)
|
||||
```
|
||||
|
||||
### 이미지 이름 규칙
|
||||
|
||||
| 원본 | 변환 후 |
|
||||
|------|---------|
|
||||
| `MSWE3.0 Manual-06_images/_page_0_Figure_0.jpeg` | `images/p06_Figure_0.jpeg` |
|
||||
| `MSWE3.0 Manual-15_images/_page_0_Picture_12.jpeg` | `images/p15_Picture_12.jpeg` |
|
||||
|
||||
- `_page_0_` 접두사 제거
|
||||
- 페이지 번호를 `p{NN}_` 형식으로 앞에 붙여 파일명 충돌 방지
|
||||
Reference in New Issue
Block a user