# PDF/DXF 문서 분석기 Flet 기반의 PDF 및 DXF 파일 업로드 및 분석 애플리케이션입니다. PDF 파일은 Google Gemini AI를 통해 이미지 분석을, DXF 파일은 ezdxf 라이브러리를 통해 도곽 정보 및 Block Reference/Attribute Reference를 추출하여 상세한 정보를 제공합니다. ![Python](https://img.shields.io/badge/Python-3.9+-blue.svg) ![Flet](https://img.shields.io/badge/Flet-0.25.1+-orange.svg) ![ezdxf](https://img.shields.io/badge/ezdxf-1.4.2+-red.svg) ![License](https://img.shields.io/badge/License-MIT-green.svg) ## 🌟 주요 기능 ### PDF 분석 기능 - 📄 **PDF 파일 업로드**: 간편한 드래그 앤 드롭 인터페이스 - 🔍 **AI 이미지 분석**: Google Gemini API를 통한 고급 이미지 분석 - 🏢 **조직별 스키마**: 국토교통부/한국도로공사 전용 분석 스키마 - 👁️ **PDF 뷰어 모달**: 별도 창에서 PDF 미리보기 및 페이지 네비게이션 ### DXF 분석 기능 (NEW) - 🏗️ **DXF 파일 지원**: CAD 도면 파일 (.dxf) 업로드 및 분석 - 📐 **도곽 정보 추출**: 도면명, 도면번호, 건설분야, 건설단계, 축척 등 - 🔧 **Block Reference 분석**: 블록 참조 및 속성 정보 완전 추출 - 📋 **Attribute Reference**: 모든 속성의 tag, text, prompt, position, bounding box 정보 - 📏 **바운딩 박스 계산**: 텍스트 및 블록의 정확한 좌표 정보 - 🎯 **ATTDEF 정보 수집**: 블록 정의에서 프롬프트 정보 자동 매핑 ### 공통 기능 - 📊 **실시간 진행률**: 분석 과정을 실시간으로 확인 - 🎨 **현대적인 UI**: 좌우 분할 레이아웃 및 Material Design 기반 인터페이스 - ⚙️ **다양한 분석 모드**: 기본, 상세, 사용자 정의 분석 - 💾 **결과 저장**: 분석 결과를 텍스트/JSON 파일로 저장 - 📱 **반응형 디자인**: 다양한 화면 크기에 대응하는 인터페이스 ## 🚀 빠른 시작 ### 1. 요구 사항 - Python 3.9 이상 - Google Gemini API 키 ### 2. 설치 ```bash # 저장소 클론 git clone https://github.com/your-username/pdf-analyzer.git cd pdf-analyzer # 가상 환경 생성 (권장) python -m venv venv # 가상 환경 활성화 # Windows: venv\\Scripts\\activate # macOS/Linux: source venv/bin/activate # 의존성 설치 pip install -r requirements.txt ``` ### 3. 환경 설정 1. `.env.example` 파일을 `.env`로 복사: ```bash copy .env.example .env # Windows cp .env.example .env # macOS/Linux ``` 2. `.env` 파일을 편집하여 Gemini API 키 설정: ```env GEMINI_API_KEY=your_actual_gemini_api_key_here ``` ### 4. 실행 ```bash python main.py ``` ## 🛠️ 설정 ### 환경 변수 `.env` 파일에서 다음 설정을 조정할 수 있습니다: ```env # 필수: Gemini API 키 GEMINI_API_KEY=your_gemini_api_key # 애플리케이션 설정 APP_TITLE=PDF 도면 분석기 APP_VERSION=1.0.0 DEBUG=False # 파일 업로드 설정 MAX_FILE_SIZE_MB=50 ALLOWED_EXTENSIONS=pdf UPLOAD_FOLDER=uploads # Gemini API 설정 GEMINI_MODEL=gemini-2.5-pro DEFAULT_PROMPT=pdf 이미지 분석하여 도면인지 어떤 정보들이 있는지 알려줘. ``` ### Gemini API 키 획득 1. [Google AI Studio](https://makersuite.google.com/app/apikey)에 접속 2. Google 계정으로 로그인 3. "Create API Key" 클릭 4. 생성된 API 키를 `.env` 파일에 추가 ## 📖 사용법 ### 기본 사용법 1. **PDF 파일 선택**: "PDF 파일 선택" 버튼을 클릭하여 분석할 PDF 파일을 선택합니다. 2. **분석 설정**: - **페이지 선택**: 첫 번째 페이지만 또는 모든 페이지 분석 선택 - **분석 모드**: 기본, 상세, 사용자 정의 중 선택 3. **분석 시작**: "분석 시작" 버튼을 클릭하여 AI 분석을 시작합니다. 4. **결과 확인**: 분석 완료 후 결과를 확인하고 필요시 저장합니다. ### 분석 모드 - **기본 분석**: 문서 유형 및 기본 정보 분석 - **상세 분석**: 도면, 도표, 텍스트 등 상세 정보 분석 - **사용자 정의**: 원하는 분석 내용을 직접 입력 ## 🏗️ 프로젝트 구조 ``` fletimageanalysis/ ├── main.py # 메인 애플리케이션 ├── config.py # 설정 관리 ├── pdf_processor.py # PDF 처리 모듈 ├── gemini_analyzer.py # Gemini API 연동 ├── ui_components.py # UI 컴포넌트 ├── requirements.txt # 의존성 목록 ├── .env.example # 환경 변수 템플릿 ├── uploads/ # 업로드 폴더 ├── assets/ # 자산 폴더 └── docs/ # 문서 폴더 ``` ## 🔧 개발 ### 개발 환경 설정 ```bash # 개발용 의존성 설치 pip install black flake8 pytest # 코드 포맷팅 black . # 코드 검사 flake8 . # 테스트 실행 pytest ``` ### 모듈 설명 #### `pdf_processor.py` - PDF 파일 검증 및 정보 추출 - PDF 페이지를 이미지로 변환 - Base64 인코딩 처리 #### `gemini_analyzer.py` - Gemini API 클라이언트 관리 - 이미지 분석 요청 및 응답 처리 - 스트리밍 분석 지원 #### `ui_components.py` - Flet UI 컴포넌트 정의 - 재사용 가능한 UI 요소들 - Material Design 스타일 적용 #### `main.py` - 메인 애플리케이션 로직 - 이벤트 처리 및 UI 통합 - 백그라운드 작업 관리 ## 🐛 문제 해결 ### 일반적인 문제들 **1. API 키 오류** ``` 오류: Gemini API 키가 설정되지 않았습니다. 해결: .env 파일에 올바른 GEMINI_API_KEY를 설정하세요. ``` **2. PDF 파일 오류** ``` 오류: 유효하지 않은 PDF 파일입니다. 해결: 손상되지 않은 PDF 파일을 사용하거나 다른 PDF로 시도하세요. ``` **3. 의존성 설치 오류** ```bash # PyMuPDF 설치 문제가 있을 경우 pip install --upgrade pip pip install PyMuPDF --no-cache-dir ``` **4. 메모리 부족 오류** ``` 해결: 큰 PDF 파일의 경우 첫 번째 페이지만 분석하거나 zoom 값을 낮춰서 이미지 크기를 줄이세요. ``` ### 로그 확인 애플리케이션 실행 시 콘솔에서 상세한 로그를 확인할 수 있습니다: ```bash python main.py 2>&1 | tee app.log ``` ## 🤝 기여하기 1. 이 저장소를 포크합니다 2. 기능 브랜치를 생성합니다 (`git checkout -b feature/AmazingFeature`) 3. 변경사항을 커밋합니다 (`git commit -m 'Add some AmazingFeature'`) 4. 브랜치에 푸시합니다 (`git push origin feature/AmazingFeature`) 5. Pull Request를 생성합니다 ## 📝 라이선스 이 프로젝트는 MIT 라이선스 하에 배포됩니다. 자세한 내용은 [LICENSE](LICENSE) 파일을 참조하세요. ## 🙏 감사의 말 - [Flet](https://flet.dev/) - 뛰어난 Python UI 프레임워크 - [Google Gemini](https://ai.google.dev/) - 강력한 AI 분석 API - [PyMuPDF](https://pymupdf.readthedocs.io/) - PDF 처리 라이브러리 ## 📞 지원 문제가 있거나 질문이 있으시면 [Issues](https://github.com/your-username/pdf-analyzer/issues) 페이지에서 이슈를 생성해 주세요. --- **🔗 관련 링크** - [Flet 문서](https://flet.dev/docs/) - [Gemini API 문서](https://ai.google.dev/gemini-api/docs) - [PyMuPDF 문서](https://pymupdf.readthedocs.io/)