feat: Implement full conversion pipeline (PDF/HWP/HWPX/HML/HTML)
- convert.py: 통합 CLI, --json 출력, --scan 폴더 모드 - converters/pdf.py: 페이지별 분류(text/diagram/mixed) + marker-pdf + PNG 렌더링 - converters/hwp.py: COM 자동화 + pyhwp fallback - converters/hwpx.py: ZIP+XML 직접 파싱, 이미지 추출 - converters/hml.py: XML 파싱, Base64 이미지 추출, colspan/rowspan HTML 표 - converters/html.py: html2text (body_width=0) - requirements.txt: 최소 의존성 - .env.example: 환경변수 템플릿 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
5
.env.example
Normal file
5
.env.example
Normal file
@@ -0,0 +1,5 @@
|
||||
# doc2md 환경변수 예시
|
||||
# 이 파일을 .env로 복사 후 값 수정
|
||||
|
||||
# ParaWiki 등 외부 프로젝트에서 이 도구를 subprocess로 호출할 때 사용
|
||||
# DOCU_CONVERTER_PATH=D:\MYCLAUDE_PROJECT\doc2md
|
||||
Reference in New Issue
Block a user