v8:문서유형 분석등록 및 추출_20260206
This commit is contained in:
@@ -27,8 +27,8 @@ except ImportError:
|
||||
print("[INFO] pytesseract 미설치 - 텍스트 잘림 필터 비활성화")
|
||||
|
||||
# ===== 경로 설정 =====
|
||||
BASE_DIR = Path(r"D:\for python\survey_test\extract") # PDF 원본 위치
|
||||
OUTPUT_BASE = Path(r"D:\for python\survey_test\process") # 출력 위치
|
||||
BASE_DIR = Path(r"D:\for python\geulbeot-light\geulbeot-light\00.test\hwpx\out") # PDF 원본 위치
|
||||
OUTPUT_BASE = Path(r"D:\for python\geulbeot-light\geulbeot-light\00.test\hwpx\out\out") # 출력 위치
|
||||
|
||||
CAPTION_PATTERN = re.compile(
|
||||
r'^\s*(?:[<\[\(\{]\s*)?(그림|figure|fig)\s*\.?\s*(?:[<\[\(\{]\s*)?0*\d+(?:\s*[-–]\s*\d+)?',
|
||||
|
||||
Reference in New Issue
Block a user