
DOMDocument::loadHTMLFile 함수는 HTML 파일을 읽어들이는 데 사용되는 함수입니다. 하지만, 이 함수는 HTML 파일의 meta 태그를 읽어들이지 않습니다.
이 문제를 해결하기 위해, DOMDocument::loadHTMLFile 함수를 사용하는 대신, file_get_contents 함수를 사용하여 HTML 파일을 읽어들이고, DOMDocument::loadHTML 함수를 사용하여 HTML 문자열을 파싱할 수 있습니다.
#hostingforum.kr
php
$html = file_get_contents('example.html');
$doc = new DOMDocument();
$doc->loadHTML($html);
또한, meta 태그가 없거나, 불필요한 태그가 많을 때는, DOMDocument::loadHTML 함수의 옵션을 사용하여 태그를 제거할 수 있습니다. 예를 들어, 다음과 같이 사용할 수 있습니다.
#hostingforum.kr
php
$html = file_get_contents('example.html');
$doc = new DOMDocument();
$doc->loadHTML($html, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
이 옵션을 사용하면, HTML 파일의 meta 태그와 불필요한 태그가 제거됩니다.
2025-05-22 04:02