
html 형식으로 저장된 본문을 text 형식으로 변환하는 방법은 여러 가지가 있습니다.
1. BeautifulSoup 라이브러리 사용: BeautifulSoup 라이브러리는 HTML/CSS 파서로, HTML 형식의 본문을 파싱하여 text 형식으로 변환할 수 있습니다.
#hostingforum.kr
python
from bs4 import BeautifulSoup
import email
# 메일 본문을 HTML 형식으로 저장한 변수
html_body = ...
# BeautifulSoup 객체 생성
soup = BeautifulSoup(html_body, 'html.parser')
# text 형식으로 변환
text_body = soup.get_text()
2. re 라이브러리 사용: re 라이브러리는 정규표현식을 사용하여 HTML 형식의 본문에서 HTML 태그를 제거할 수 있습니다.
#hostingforum.kr
python
import re
import email
# 메일 본문을 HTML 형식으로 저장한 변수
html_body = ...
# HTML 태그 제거
text_body = re.sub('<.*?>', '', html_body)
3. email 라이브러리 사용: email 라이브러리는 메일 본문을 파싱하여 text 형식으로 변환할 수 있습니다.
#hostingforum.kr
python
import email
# 메일 본문을 HTML 형식으로 저장한 변수
html_body = ...
# email 라이브러리 사용
msg = email.message_from_string(html_body)
text_body = msg.get_payload(decode=True).decode('utf-8')
이러한 방법 중 하나를 선택하여 html 형식의 본문을 text 형식으로 변환할 수 있습니다.
2025-05-23 13:18