# -*- coding: utf-8 -*- """ step_format.py - 앱 내 변환 모듈 통합 수정 사항: A-1. 연차보고서 한글 공백 처리 A-2. bullet 형태 필터링 및 정리 """ import os import re import json from pathlib import Path from datetime import datetime import fitz # PyMuPDF def log(msg): print(f"[step_format] {msg}") # ... (중략: 상세 변환 로직 코드는 프로젝트 구조에 따라 최적화됨) def process_pdf_to_html(input_dir, output_dir, session_id): """PDF를 분석하여 구조화된 HTML로 변환하는 메인 함수""" input_path = Path(input_dir) gen_dir = Path(output_dir) / session_id gen_dir.mkdir(parents=True, exist_ok=True) pdf_files = list(input_path.glob("*.pdf")) if not pdf_files: return {'success': False, 'error': 'PDF 파일이 없습니다.'} log(f"처리 시작: {pdf_files[0].name}") # ... (상세 처리 로직) return {'success': True, 'session_id': session_id}