Step-00: Total Reset - Clear prompts folder
This commit is contained in:
@@ -1,227 +0,0 @@
|
||||
# AI 기반 문서 생성 프로세스 — 프롬프트 모음
|
||||
|
||||
## 개요
|
||||
|
||||
기존 자료를 바탕으로 보고서·기획서·기술문서를 생성하기 위한 단계별 AI 프롬프트 모음입니다.
|
||||
각 단계는 독립적인 AI 작업 단위로 구성되며, 이전 단계의 출력물이 다음 단계의 입력값으로 연결되는 파이프라인 구조입니다.
|
||||
각 프롬프트 파일에는 실제 AI에게 전달하는 지시문과, 해당 지시문의 구조와 이유를 설명하는 해설 파일이 쌍으로 구성되어 있습니다.
|
||||
|
||||
---
|
||||
|
||||
## 전체 프로세스
|
||||
|
||||
```
|
||||
내부 자료 (PDF, PPT, DOCX 등)
|
||||
↓
|
||||
[01] 파일 내용 추출 → MD + JSON
|
||||
↓
|
||||
[02] 문서 구조 설계 → 목차 + 출처 설계서 JSON
|
||||
↓
|
||||
[03] 외부 자료 조사 → 보완된 설계서 JSON
|
||||
↓
|
||||
[04] 본문 생성 및 검토 → 최종 본문 MD
|
||||
↓
|
||||
[05-pre] 시각화 레퍼런스 정리 → 레퍼런스 라이브러리 JSON
|
||||
↓
|
||||
[05] 시각화 생성 → 절별 시각화 HTML 파일
|
||||
↓
|
||||
[06] 내용 취합 및 HTML 변환 → 통합 보고서 HTML
|
||||
↓
|
||||
[07] A4 보고서 퍼블리싱 → A4 규격 보고서 HTML (인쇄·PDF 저장 가능)
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 단계별 프롬프트
|
||||
|
||||
---
|
||||
|
||||
### 01. 파일 내용 추출
|
||||
`사용 AI : Gemini, Claude`
|
||||
|
||||
기존 문서에서 텍스트와 표를 있는 그대로 추출합니다.
|
||||
추론·요약·수정 없이 원본 그대로를 MD와 JSON으로 출력하는 것이 핵심입니다.
|
||||
Top-to-Bottom 순차 추출, Visual Grid Rule(선 기반 표 병합)이 핵심 원칙입니다.
|
||||
|
||||
**지원 형식** : `.pdf` `.ppt/x` `.doc/x` `.png` `.jpg` `.md` `.txt`
|
||||
|
||||
> 🚨 **HWP/HWPX 처리 불가** : 한컴 독자 포맷으로 AI가 직접 읽을 수 없음. 사전에 PDF 또는 DOCX로 변환 필요.
|
||||
> 🚨 **이미지 추출 불가** : AI는 문서 내 이미지를 파일로 저장할 수 없음. 위치 표시(주석 태그)만 가능하며 실제 추출은 코드로 별도 처리 필요.
|
||||
|
||||
---
|
||||
|
||||
### 02. 문서 구조 설계
|
||||
`사용 AI : GPT`
|
||||
|
||||
업로드된 자료를 분석하여 보고서의 목차를 설계하고, 각 목차 항목별 핵심 내용과 출처를 함께 정리합니다.
|
||||
자료에 근거가 없는 항목은 `[근거없음]`, 자료 간 내용이 다를 경우 `[상충]` 태그로 명시합니다.
|
||||
확정된 구조는 JSON으로 출력되어 이후 단계의 공통 입력값이 됩니다.
|
||||
|
||||
---
|
||||
|
||||
### 03. 외부 자료 조사
|
||||
`사용 AI : Perplexity, Liner`
|
||||
|
||||
확정된 목차를 기준으로 내부 자료만으로 부족한 항목을 외부에서 보완 조사합니다.
|
||||
AI가 검색 쿼리를 설계하면 작성자가 직접 검색 후 결과를 붙여넣는 방식으로 운용합니다.
|
||||
|
||||
- Perplexity : 최신 통계·동향·정책 조사
|
||||
- Liner : 논문·전문 보고서·기술 자료 조사
|
||||
|
||||
> ⚠️ AI가 Perplexity·Liner를 직접 실행할 수 없어 수동 운용이 필요합니다.
|
||||
|
||||
---
|
||||
|
||||
### 04. 본문 생성 및 검토
|
||||
`사용 AI : Skywork, Gemini, Genspark`
|
||||
|
||||
구조 설계서(내부 자료 + 외부 조사 결과)를 기반으로 절(Section) 단위로 본문을 생성합니다.
|
||||
생성 직후 미니 검토(출처·문체·중복·수치), 전체 완성 후 전체 맥락 검토(흐름·중복·문체통일)의 2단계 검토를 수행합니다.
|
||||
문체는 보고체(간결체) 고정입니다.
|
||||
|
||||
---
|
||||
|
||||
### 05-pre. 시각화 레퍼런스 정리
|
||||
`사용 AI : Genspark`
|
||||
|
||||
시각화 생성에 앞서 작성자가 업로드한 이미지·HTML 파일을 분석하여 스타일·구조 패턴을 정리합니다.
|
||||
레퍼런스의 내용이 아닌 스타일과 레이아웃 구조만 추출하며, 공통 스타일 가이드를 함께 구축합니다.
|
||||
분석 결과는 JSON으로 출력되어 05단계의 입력값이 됩니다.
|
||||
|
||||
---
|
||||
|
||||
### 05. 시각화 생성
|
||||
`사용 AI : Genspark, Gemini`
|
||||
|
||||
05-pre에서 구축된 레퍼런스 라이브러리의 스타일을 참조하여, 절 본문 내용을 HTML/CSS/JS로 시각화합니다.
|
||||
텍스트는 100% 본문에서만 가져오며 레퍼런스의 내용을 유입시키지 않습니다.
|
||||
A4 삽입 기준(가로 700px 이내)과 인쇄 대응(`@media print`)을 포함합니다.
|
||||
|
||||
---
|
||||
|
||||
### 06. 내용 취합(본문·시각화) 및 전체 HTML 변환
|
||||
`사용 AI : Claude, GPT`
|
||||
|
||||
04단계 본문 MD와 05단계 시각화 HTML 파일들을 하나의 보고서 HTML로 통합합니다.
|
||||
표지·목차·요약이 이 단계에서 추가됩니다.
|
||||
|
||||
> **핵심 원칙** : 본문 텍스트를 추론·생성·삭제·요약·수정하지 않습니다. 변환이지 편집이 아닙니다. 오탈자가 있어도 원본 그대로 옮깁니다.
|
||||
|
||||
출력물은 07단계 A4 퍼블리싱 엔진이 처리할 수 있는 4개 박스 구조(box-cover / box-toc / box-summary / box-content)로 구성됩니다.
|
||||
|
||||
---
|
||||
|
||||
### 07. A4 보고서 퍼블리싱
|
||||
`사용 AI : Gemini`
|
||||
|
||||
06단계 통합 HTML을 A4 규격(210×297mm) 보고서 형태로 재조립합니다.
|
||||
표지 → 목차 → 요약 → 본문 순서로 렌더링하며, 페이지 분할·표 배치·자간 최적화를 자동 처리합니다.
|
||||
브라우저에서 인쇄하거나 PDF로 저장할 수 있는 최종 출력물을 생성합니다.
|
||||
|
||||
---
|
||||
|
||||
## 한계 및 제약 사항
|
||||
|
||||
### 출력 형식의 한계
|
||||
|
||||
AI 프롬프트만으로 생성 가능한 최종 파일 형식은 HTML에 한정됩니다.
|
||||
|
||||
| 형식 | 가능 여부 | 현재 대안 |
|
||||
|------|---------|---------|
|
||||
| PDF | ✅ 브라우저 인쇄 → PDF 저장 (Chrome 권장) | — |
|
||||
| HWP | ❌ AI 직접 생성 불가 | 수동 복사 또는 LibreOffice 변환 |
|
||||
| PPTX | ❌ AI 직접 생성 불가 | python-pptx 별도 코드 필요 |
|
||||
| XLSX | ❌ AI 직접 생성 불가 | openpyxl 별도 코드 필요 |
|
||||
| 이미지 추출 | ❌ AI 직접 추출 불가 | PyMuPDF 별도 코드 필요 |
|
||||
|
||||
### 운용상의 한계
|
||||
|
||||
**단계 간 연결이 수동이다** : 각 단계의 출력물을 작성자가 직접 복사하여 다음 단계 AI에 붙여넣어야 합니다.
|
||||
|
||||
**외부 검색이 수동이다** : Perplexity·Liner 검색은 AI가 직접 실행할 수 없어 작성자가 수행 후 결과를 붙여넣어야 합니다.
|
||||
|
||||
**HWP 입력 불가** : 내부 자료가 HWP 형식인 경우 PDF 또는 DOCX로 사전 변환이 필요합니다.
|
||||
|
||||
**컨텍스트 한계** : 분량이 긴 문서를 한 번에 생성하면 AI의 처리 품질이 저하됩니다. 이것이 04단계에서 절 단위 생성이 필수인 이유입니다.
|
||||
|
||||
**문서 유형 고정** : 현재 프롬프트는 보고서 형식과 보고체 문체에 최적화되어 있습니다. 제안서·기획안 등 다른 유형을 처리하려면 프롬프트 구조를 수동으로 수정해야 합니다.
|
||||
|
||||
---
|
||||
|
||||
## 추가로 필요한 기능과 그 이유
|
||||
|
||||
현재 프로세스는 AI 프롬프트 단위의 수작업 파이프라인입니다. 반복 사용과 품질 안정화를 위해 아래 기능들이 보완되어야 합니다.
|
||||
|
||||
---
|
||||
|
||||
### 1. HWP 전처리 모듈
|
||||
|
||||
**왜 필요한가** : 국내 공공기관·건설업계의 내부 자료 대부분은 HWP 형식입니다. 현재는 01단계 실행 전에 작성자가 수동으로 PDF 변환을 해야 하며, 변환 과정에서 표 구조나 레이아웃이 손상되는 경우가 빈번합니다. pyhwpx 또는 LibreOffice CLI를 활용한 자동 변환 모듈이 없으면 이 프로세스의 입력 범위가 실무 환경과 괴리됩니다.
|
||||
|
||||
---
|
||||
|
||||
### 2. 이미지 추출 전처리 모듈
|
||||
|
||||
**왜 필요한가** : 01단계에서 AI는 이미지의 위치만 주석으로 표시할 뿐 파일 추출은 불가합니다. 도면·그래프·사진이 포함된 기술 문서는 이미지 없이는 보고서가 불완전합니다. PyMuPDF 기반의 이미지 추출 모듈이 별도로 존재해야 01단계 결과물이 완결성을 가집니다.
|
||||
|
||||
---
|
||||
|
||||
### 3. 단계 간 파이프라인 자동 연결
|
||||
|
||||
**왜 필요한가** : 현재는 각 단계 AI의 출력물(MD, JSON, HTML)을 작성자가 수동으로 복사하여 다음 단계 AI에 붙여넣어야 합니다. 이 반복 작업은 실수와 피로를 유발하며, 대량 문서 처리 시 병목이 됩니다. n8n 등의 워크플로우 도구를 통해 단계별 출력물이 자동으로 다음 단계 입력으로 전달되는 오케스트레이션이 필요합니다.
|
||||
|
||||
---
|
||||
|
||||
### 4. 외부 조사 도구 자동 연동
|
||||
|
||||
**왜 필요한가** : 03단계에서 AI가 설계한 검색 쿼리를 Perplexity·Liner에서 실행하는 것은 작성자의 수동 작업입니다. 이 단계가 수동인 한 프로세스 자동화는 이 지점에서 반드시 끊깁니다. Perplexity API 또는 웹 검색 기능을 AI가 직접 호출하여 결과를 구조 설계서 JSON에 자동 병합하는 기능이 필요합니다.
|
||||
|
||||
---
|
||||
|
||||
### 5. 파일 형식 변환 모듈 (HWP·PPTX·XLSX 출력)
|
||||
|
||||
**왜 필요한가** : 최종 출력물이 HTML과 PDF에 한정되어 실무 제출 형식과 불일치하는 경우가 많습니다. HWP 제출이 요구되는 공공기관 보고서, PPTX 형식의 발표 자료, XLSX 형식의 실적 정리표 등은 현재 프로세스로 생성이 불가합니다. python-pptx, openpyxl, LibreOffice 변환 등 코드 기반 후처리 모듈이 없으면 최종 납품물 생성 단계에서 다시 수작업이 개입됩니다.
|
||||
|
||||
---
|
||||
|
||||
### 6. 문서 유형별 프롬프트 세트 분리
|
||||
|
||||
**왜 필요한가** : 현재 02~04단계 프롬프트는 보고서 형식과 보고체 문체에 고정되어 있습니다. 기획안은 목차 구조가 다르고, 제안서는 설득형 문체가 필요하며, 기술보고서는 수식·도면 참조 방식이 다릅니다. 문서 유형이 달라질 때마다 프롬프트 전체를 수정해야 한다면 반복 활용성이 크게 떨어집니다. 유형별로 특화된 프롬프트 세트가 별도로 구성되어야 합니다.
|
||||
|
||||
---
|
||||
|
||||
### 7. 시각화 템플릿 라이브러리
|
||||
|
||||
**왜 필요한가** : 05-pre 단계에서 매번 레퍼런스 이미지나 HTML을 새로 업로드하고 분석하는 과정은 반복 작업입니다. 프로세스 흐름도, 단계별 구조도, 비교표, 개념 관계도 등 자주 사용되는 시각화 유형을 사전에 HTML 템플릿으로 제작하여 라이브러리로 관리하면, 05단계에서 레퍼런스 분석 없이 바로 템플릿을 참조할 수 있습니다. 현재의 05-pre 단계를 생략하거나 간소화할 수 있습니다.
|
||||
|
||||
---
|
||||
|
||||
### 8. 프롬프트 버전 관리
|
||||
|
||||
**왜 필요한가** : 각 단계의 프롬프트는 실제 사용 결과에 따라 지속적으로 개선됩니다. 어떤 버전의 프롬프트로 어떤 결과물이 만들어졌는지 추적이 되지 않으면, 개선이 퇴행인지 진보인지 판단할 수 없습니다. 프롬프트 파일의 버전 번호 관리와 변경 이력 기록이 필요합니다.
|
||||
|
||||
---
|
||||
|
||||
## 파일 구성
|
||||
|
||||
```
|
||||
prompts/
|
||||
├── 01. 기존 문서에서 텍스트,표 추출_Gemini,Claude.md
|
||||
├── 02. 업로드 문서 기반 목차 구성_GPT.md
|
||||
├── 03. 목차에 해당하는 외부 자료 조사_perplexity,liner.md
|
||||
├── 04. 본문 생성 및 검토_skywork,gemini,genspark.md
|
||||
├── 05-pre. 시각화 레퍼런스 정리_Genspark.md
|
||||
├── 05. 본문의 구조화,시각화 생성_Genspark,Gemini.md
|
||||
├── 06. 내용 취합(본문,시각화) 및 전체 HTML 변환.md
|
||||
└── 07. A4 규격 보고서 형식으로 변환_Gemini.md
|
||||
|
||||
explanations/
|
||||
├── 프롬프트 구조 및 내용 해설 (1).md ← 07단계 해설
|
||||
├── 프롬프트 구조 및 내용 해설 (2).md ← 01단계 해설 (파일 형식 제한 포함)
|
||||
├── 프롬프트 구조 및 내용 해설 (3).md ← 02단계 해설
|
||||
├── 프롬프트 구조 및 내용 해설 (4).md ← 03단계 해설
|
||||
├── 프롬프트 구조 및 내용 해설 (5).md ← 04단계 해설
|
||||
├── 프롬프트 구조 및 내용 해설 (6).md ← 05-pre 단계 해설
|
||||
├── 프롬프트 구조 및 내용 해설 (7).md ← 05단계 해설
|
||||
└── 프롬프트 구조 및 내용 해설 (8).md ← 06단계 해설
|
||||
```
|
||||
Reference in New Issue
Block a user