# Conflicts: # merge_excel_files.py # requirements-cli.txt
PDF/DXF 문서 분석기
Flet 기반의 PDF 및 DXF 파일 업로드 및 분석 애플리케이션입니다. PDF 파일은 Google Gemini AI를 통해 이미지 분석을, DXF 파일은 ezdxf 라이브러리를 통해 도곽 정보 및 Block Reference/Attribute Reference를 추출하여 상세한 정보를 제공합니다.
🌟 주요 기능
PDF 분석 기능
- 📄 PDF 파일 업로드: 간편한 드래그 앤 드롭 인터페이스
- 🔍 AI 이미지 분석: Google Gemini API를 통한 고급 이미지 분석
- 🏢 조직별 스키마: 국토교통부/한국도로공사 전용 분석 스키마
- 👁️ PDF 뷰어 모달: 별도 창에서 PDF 미리보기 및 페이지 네비게이션
DXF 분석 기능 (NEW)
- 🏗️ DXF 파일 지원: CAD 도면 파일 (.dxf) 업로드 및 분석
- 📐 도곽 정보 추출: 도면명, 도면번호, 건설분야, 건설단계, 축척 등
- 🔧 Block Reference 분석: 블록 참조 및 속성 정보 완전 추출
- 📋 Attribute Reference: 모든 속성의 tag, text, prompt, position, bounding box 정보
- 📏 바운딩 박스 계산: 텍스트 및 블록의 정확한 좌표 정보
- 🎯 ATTDEF 정보 수집: 블록 정의에서 프롬프트 정보 자동 매핑
공통 기능
- 📊 실시간 진행률: 분석 과정을 실시간으로 확인
- 🎨 현대적인 UI: 좌우 분할 레이아웃 및 Material Design 기반 인터페이스
- ⚙️ 다양한 분석 모드: 기본, 상세, 사용자 정의 분석
- 💾 결과 저장: 분석 결과를 텍스트/JSON 파일로 저장
- 📱 반응형 디자인: 다양한 화면 크기에 대응하는 인터페이스
🚀 빠른 시작
1. 요구 사항
- Python 3.9 이상
- Google Gemini API 키
2. 설치
# 저장소 클론
git clone https://github.com/your-username/pdf-analyzer.git
cd pdf-analyzer
# 가상 환경 생성 (권장)
python -m venv venv
# 가상 환경 활성화
# Windows:
venv\\Scripts\\activate
# macOS/Linux:
source venv/bin/activate
# 의존성 설치
pip install -r requirements.txt3. 환경 설정
.env.example파일을.env로 복사:
.env파일을 편집하여 Gemini API 키 설정:
GEMINI_API_KEY=your_actual_gemini_api_key_here
4. 실행
🛠️ 설정
환경 변수
.env 파일에서 다음 설정을 조정할 수 있습니다:
# 필수: Gemini API 키
GEMINI_API_KEY=your_gemini_api_key
# 애플리케이션 설정
APP_TITLE=PDF 도면 분석기
APP_VERSION=1.0.0
DEBUG=False
# 파일 업로드 설정
MAX_FILE_SIZE_MB=50
ALLOWED_EXTENSIONS=pdf
UPLOAD_FOLDER=uploads
# Gemini API 설정
GEMINI_MODEL=gemini-2.5-pro
DEFAULT_PROMPT=pdf 이미지 분석하여 도면인지 어떤 정보들이 있는지 알려줘.
Gemini API 키 획득
- Google AI Studio에 접속
- Google 계정으로 로그인
- “Create API Key” 클릭
- 생성된 API 키를
.env파일에 추가
📖 사용법
기본 사용법
PDF 파일 선택: “PDF 파일 선택” 버튼을 클릭하여 분석할 PDF 파일을 선택합니다.
분석 설정:
- 페이지 선택: 첫 번째 페이지만 또는 모든 페이지 분석 선택
- 분석 모드: 기본, 상세, 사용자 정의 중 선택
분석 시작: “분석 시작” 버튼을 클릭하여 AI 분석을 시작합니다.
결과 확인: 분석 완료 후 결과를 확인하고 필요시 저장합니다.
분석 모드
- 기본 분석: 문서 유형 및 기본 정보 분석
- 상세 분석: 도면, 도표, 텍스트 등 상세 정보 분석
- 사용자 정의: 원하는 분석 내용을 직접 입력
🏗️ 프로젝트 구조
fletimageanalysis/
├── main.py # 메인 애플리케이션
├── config.py # 설정 관리
├── pdf_processor.py # PDF 처리 모듈
├── gemini_analyzer.py # Gemini API 연동
├── ui_components.py # UI 컴포넌트
├── requirements.txt # 의존성 목록
├── .env.example # 환경 변수 템플릿
├── uploads/ # 업로드 폴더
├── assets/ # 자산 폴더
└── docs/ # 문서 폴더
🔧 개발
개발 환경 설정
모듈 설명
pdf_processor.py
- PDF 파일 검증 및 정보 추출
- PDF 페이지를 이미지로 변환
- Base64 인코딩 처리
gemini_analyzer.py
- Gemini API 클라이언트 관리
- 이미지 분석 요청 및 응답 처리
- 스트리밍 분석 지원
ui_components.py
- Flet UI 컴포넌트 정의
- 재사용 가능한 UI 요소들
- Material Design 스타일 적용
main.py
- 메인 애플리케이션 로직
- 이벤트 처리 및 UI 통합
- 백그라운드 작업 관리
🐛 문제 해결
일반적인 문제들
1. API 키 오류
오류: Gemini API 키가 설정되지 않았습니다.
해결: .env 파일에 올바른 GEMINI_API_KEY를 설정하세요.
2. PDF 파일 오류
오류: 유효하지 않은 PDF 파일입니다.
해결: 손상되지 않은 PDF 파일을 사용하거나 다른 PDF로 시도하세요.
3. 의존성 설치 오류
4. 메모리 부족 오류
해결: 큰 PDF 파일의 경우 첫 번째 페이지만 분석하거나
zoom 값을 낮춰서 이미지 크기를 줄이세요.
로그 확인
애플리케이션 실행 시 콘솔에서 상세한 로그를 확인할 수 있습니다:
🤝 기여하기
- 이 저장소를 포크합니다
- 기능 브랜치를 생성합니다
(
git checkout -b feature/AmazingFeature) - 변경사항을 커밋합니다
(
git commit -m 'Add some AmazingFeature') - 브랜치에 푸시합니다
(
git push origin feature/AmazingFeature) - Pull Request를 생성합니다
📝 라이선스
이 프로젝트는 MIT 라이선스 하에 배포됩니다. 자세한 내용은 LICENSE 파일을 참조하세요.
🙏 감사의 말
- Flet - 뛰어난 Python UI 프레임워크
- Google Gemini - 강력한 AI 분석 API
- PyMuPDF - PDF 처리 라이브러리
📞 지원
문제가 있거나 질문이 있으시면 Issues 페이지에서 이슈를 생성해 주세요.
🔗 관련 링크
Languages
Python
100%