[Code 개선] #21. [Parser] 제목 계층 구조의 논리적 연속성 검증 및 강제 보정 로직 구현 #25

Open
opened 2026-03-05 11:56:37 +09:00 by Kyeongmin · 0 comments
Owner

1. 목표

제목 계층(H1~H6)이 논리적으로 건너뛰어지는 경우(예: H1 다음 바로 H3)를 탐지하여 강제로 교정함으로써, HWP 개요 번호 체계와 문서의 논리적 구조를 보호합니다.

2. 상세 원인 및 배경

  • LLM이 생성한 HTML이나 웹에서 수집한 데이터는 시각적 효과를 위해 계층을 임의로 사용하는 경우가 많습니다.
  • HWP 변환 시 개요 1 다음 개요 2 없이 개요 3이 오면 번호가 1. -> 1.1.1과 같이 기형적으로 생성되거나 스타일 적용이 누락될 수 있습니다.

Original: Kyeongmin/test#51

### 1. 목표 제목 계층(H1~H6)이 논리적으로 건너뛰어지는 경우(예: H1 다음 바로 H3)를 탐지하여 강제로 교정함으로써, HWP 개요 번호 체계와 문서의 논리적 구조를 보호합니다. ### 2. 상세 원인 및 배경 - LLM이 생성한 HTML이나 웹에서 수집한 데이터는 시각적 효과를 위해 계층을 임의로 사용하는 경우가 많습니다. - HWP 변환 시 `개요 1` 다음 `개요 2` 없이 `개요 3`이 오면 번호가 `1. -> 1.1.1`과 같이 기형적으로 생성되거나 스타일 적용이 누락될 수 있습니다. --- *Original: Kyeongmin/test#51*
Kyeongmin added this to the [Code 개선] 필요 시 나중에 진행 milestone 2026-03-05 12:30:08 +09:00
Sign in to join this conversation.
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: Kyeongmin/_Geulbeot#25