Hierarchy Fix: Purpose/Domain/File - Processing Specs

This commit is contained in:
2026-03-05 14:37:58 +09:00
parent 48215e1619
commit 131b12369e

View File

@@ -0,0 +1,16 @@
---
source: D:\for python\geulbeot-light\converters\pipeline\step4_chunk.py
category: domain
---
## 데이터 처리 및 이미지 패턴 규정
1. **이미지 추출 정규식 (Regex):**
- 패턴: `!\[([^\]]*)\]\(([^)]+)\)`
2. **청크 분할 임계값:**
- 최소 길이: 500자 (이하일 경우 병합)
- 최대 컨텍스트: 12,000자
3. **시스템 로그 표준:**
- [시간] [로그레벨] [소스명] 형식 준수