1
Wiki 3 2 Stage 1A Topic Extraction
kyeongmin edited this page 2026-04-01 16:16:50 +09:00

# Stage 1A Kei Topic Extraction

목적

콘텐츠에서 주요 꼭지와 관계를 추출해 구조적 판단의 초안을 만든다.

이 stage는 현재 구현에서는 Kei API 의존이 큰 구간이지만, 목표 구조에서는 위키 기준과 이슈 기록을 바탕으로 Codex 또는 Claude가 수행할 수 있어야 한다.

입력

  • 정규화된 MDX
  • 작업 목적 요약
  • 필요 시 이전 run의 해석 결과

처리 내용

  • 주요 topic을 추출한다.
  • topic 간 relation_type을 정리한다.
  • 표현 방향에 대한 expression_hint 초안을 만든다.
  • source_data 후보를 잡는다.

출력

  • topic 목록
  • relation 정보
  • expression_hint 초안
  • source_data 초안
  • run 폴더에 남길 해석 결과 파일

검증 포인트

  • 핵심 topic이 빠지지 않았는가
  • relation이 원문 의미와 맞는가
  • expression_hint가 지나치게 임의적이지 않은가
  • 후속 Stage 1B가 바로 사용할 수 있을 정도로 명확한가

현재 구현과 목표 구조

  • 현재 구현: src/kei_client.pyclassify_content 호출에 크게 의존
  • 목표 구조: 위키 1 기준 + 위키 2 절차 + 이슈/run 기록을 바탕으로 사람이 읽을 수 있는 topic 결과를 직접 생성

관련 코드

실패 시 처리

  • topic 추출 범위를 조정한다.
  • 누락된 핵심 항목을 다시 보강한다.
  • relation_type 판단을 다시 검토한다.