fix: LaTeX 백슬래시 복원, HWP 인코딩 오류 수정, 다이어그램 감지 튜닝

- pdf.py: marker-pdf가 손상시킨 \times·\frac 등 LaTeX 백슬래시 복원 후처리 추가
- pdf.py: 다이어그램 감지에 절대 drawing 수 기준(>= 40) 추가 (대형 엔지니어링 페이지 대응)
- hwp.py: COM 타임아웃 메시지의 em dash → ASCII (cp949 인코딩 오류 수정)
- convert.py: Windows stdout/stderr UTF-8 강제 설정

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
minsung
2026-04-20 15:56:11 +09:00
parent 2ec2759a20
commit 1d40d90242
3 changed files with 44 additions and 6 deletions

View File

@@ -43,7 +43,7 @@ def _com_hwp_to_hml(hwp_path: Path, hml_path: Path, timeout: int = 15) -> bool:
t.start()
t.join(timeout)
if t.is_alive():
print(f' COM 타임아웃 ({timeout}초) pyhwp로 전환')
print(f' COM 타임아웃 ({timeout}초) -> pyhwp로 전환')
return result[0]