[Code 개선] #11. [Parser] StyleAnalyzer: HTML 시멘틱 태그 우선 분석 로직 구현 #35
Reference in New Issue
Block a user
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
1. 목표
현재 정규표현식 패턴에 과하게 의존하는 역할 분류 로직을 개선하여, HTML 고유의 시멘틱 태그(
h1~h6)를 최우선적으로 신뢰하고 분석하도록 구조를 변경합니다.2. 상세 원인 및 배경
StyleAnalyzer는 태그가p나div여도 내용이 "1.1"로 시작하면H2로 분류합니다.<h1>태그가 있어도 번호 패턴이 없으면 본문(BODY)으로 밀려날 가능성이 있습니다.Original: Kyeongmin/test#41