feat: MD 파일 병합 및 이미지 경로 통합 스크립트 추가 (#1)
- merge_markdown.py: 96개 페이지별 MD를 단일 파일로 병합
- 이미지를 output/images/ 폴더로 통합, p{NN}_ prefix로 파일명 충돌 방지
- file_range 파라미터로 부분 테스트 가능
- docs/tutorial.md: merge 명령어 및 사용법 문서화
- docs/history: 작업 이력 파일 추가
소요 시간: 10분 | Context: input 18k / output 2k tokens
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
96
requirements.txt
Normal file
96
requirements.txt
Normal file
@@ -0,0 +1,96 @@
|
||||
annotated-types==0.7.0
|
||||
anthropic==0.46.0
|
||||
anyio==4.12.1
|
||||
beautifulsoup4==4.14.3
|
||||
brotli==1.2.0
|
||||
certifi==2026.1.4
|
||||
cffi==2.0.0
|
||||
cfgv==3.5.0
|
||||
charset-normalizer==3.4.4
|
||||
click==8.3.1
|
||||
cobble==0.1.4
|
||||
colorama==0.4.6
|
||||
cssselect2==0.8.0
|
||||
distlib==0.4.0
|
||||
distro==1.9.0
|
||||
EbookLib==0.18
|
||||
einops==0.8.1
|
||||
et_xmlfile==2.0.0
|
||||
filelock==3.20.3
|
||||
filetype==1.2.0
|
||||
fonttools==4.61.1
|
||||
fsspec==2026.1.0
|
||||
ftfy==6.3.1
|
||||
google-auth==2.47.0
|
||||
google-genai==1.59.0
|
||||
h11==0.16.0
|
||||
httpcore==1.0.9
|
||||
httpx==0.28.1
|
||||
huggingface-hub==0.36.0
|
||||
identify==2.6.16
|
||||
idna==3.11
|
||||
Jinja2==3.1.6
|
||||
jiter==0.12.0
|
||||
joblib==1.5.3
|
||||
lxml==6.0.2
|
||||
mammoth==1.11.0
|
||||
markdown2==2.5.4
|
||||
markdownify==1.2.2
|
||||
marker-pdf==1.10.1
|
||||
MarkupSafe==3.0.3
|
||||
mpmath==1.3.0
|
||||
networkx==3.6.1
|
||||
nodeenv==1.10.0
|
||||
numpy==2.4.1
|
||||
openai==1.109.1
|
||||
opencv-python-headless==4.11.0.86
|
||||
openpyxl==3.1.5
|
||||
packaging==25.0
|
||||
pdftext==0.6.3
|
||||
pillow==10.4.0
|
||||
platformdirs==4.5.1
|
||||
pre_commit==4.5.1
|
||||
psutil==7.2.1
|
||||
pyasn1==0.6.2
|
||||
pyasn1_modules==0.4.2
|
||||
pycparser==2.23
|
||||
pydantic==2.12.5
|
||||
pydantic-settings==2.12.0
|
||||
pydantic_core==2.41.5
|
||||
pydyf==0.12.1
|
||||
PyMuPDF==1.26.7
|
||||
pypdfium2==4.30.0
|
||||
pyphen==0.17.2
|
||||
python-dotenv==1.2.1
|
||||
python-pptx==1.0.2
|
||||
PyYAML==6.0.3
|
||||
RapidFuzz==3.14.3
|
||||
regex==2024.11.6
|
||||
requests==2.32.5
|
||||
rsa==4.9.1
|
||||
safetensors==0.7.0
|
||||
scikit-learn==1.8.0
|
||||
scipy==1.17.0
|
||||
six==1.17.0
|
||||
sniffio==1.3.1
|
||||
soupsieve==2.8.1
|
||||
surya-ocr==0.17.0
|
||||
sympy==1.14.0
|
||||
tenacity==9.1.2
|
||||
threadpoolctl==3.6.0
|
||||
tinycss2==1.5.1
|
||||
tinyhtml5==2.0.0
|
||||
tokenizers==0.22.2
|
||||
torch==2.9.1
|
||||
tqdm==4.67.1
|
||||
transformers==4.57.6
|
||||
typing-inspection==0.4.2
|
||||
typing_extensions==4.15.0
|
||||
urllib3==2.6.3
|
||||
virtualenv==20.36.1
|
||||
wcwidth==0.2.14
|
||||
weasyprint==63.1
|
||||
webencodings==0.5.1
|
||||
websockets==15.0.1
|
||||
xlsxwriter==3.2.9
|
||||
zopfli==0.4.0
|
||||
Reference in New Issue
Block a user