From 0d8778d0a423a7cbe591db8429705390db101796 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=EC=9D=B4=EA=B2=BD=EB=AF=BC?= Date: Thu, 5 Mar 2026 14:08:39 +0900 Subject: [PATCH] Upload refined pipeline logic: Corpus Generation --- .../General_데이터 처리 파이프라인_코퍼스생성_v01.md | 10 ++++++++++ 1 file changed, 10 insertions(+) create mode 100644 02. Prompts/진행과정/데이터 처리 파이프라인/General_데이터 처리 파이프라인_코퍼스생성_v01.md diff --git a/02. Prompts/진행과정/데이터 처리 파이프라인/General_데이터 처리 파이프라인_코퍼스생성_v01.md b/02. Prompts/진행과정/데이터 처리 파이프라인/General_데이터 처리 파이프라인_코퍼스생성_v01.md new file mode 100644 index 0000000..9cae0a3 --- /dev/null +++ b/02. Prompts/진행과정/데이터 처리 파이프라인/General_데이터 처리 파이프라인_코퍼스생성_v01.md @@ -0,0 +1,10 @@ +--- +source: D:\for python\geulbeot(history)\geulbeot-light(6th)_0128\geulbeot-light\converters\pipeline\step6_corpus.py +--- + +[의미 기반 로직 추출 완료] +# Corpus 생성 가이드 +1. 요약된 청크(Chunk)들을 수집한다. +2. 각 청크에 메타데이터(페이지, 출처)를 부여한다. +3. RAG(검색 증강 생성) 최적화를 위해 임베딩 처리를 준비한다. +...