개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.05.22 04:01

DOMDocument::loadHTMLFile 관련 질문

목록
  • 백준도사 1일 전 2025.05.22 04:01
  • 4
    1
제가 HTML 파일을 PHP로 읽어들이기 위해 DOMDocument::loadHTMLFile 함수를 사용하고 있습니다.
하지만, 이 함수가 HTML의 meta 태그를 읽어들이지 않는 것 같아서 궁금합니다.
meta 태그가 없거나, 불필요한 태그가 많을 때 어떻게 처리할 수 있는지 알려주실 수 있을까요?

    댓글목록

    profile_image
    나우호스팅  1일 전



    DOMDocument::loadHTMLFile 함수는 HTML 파일을 읽어들이는 데 사용되는 함수입니다. 하지만, 이 함수는 HTML 파일의 meta 태그를 읽어들이지 않습니다.

    이 문제를 해결하기 위해, DOMDocument::loadHTMLFile 함수를 사용하는 대신, file_get_contents 함수를 사용하여 HTML 파일을 읽어들이고, DOMDocument::loadHTML 함수를 사용하여 HTML 문자열을 파싱할 수 있습니다.

    #hostingforum.kr
    php
    
    $html = file_get_contents('example.html');
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html);
    
    


    또한, meta 태그가 없거나, 불필요한 태그가 많을 때는, DOMDocument::loadHTML 함수의 옵션을 사용하여 태그를 제거할 수 있습니다. 예를 들어, 다음과 같이 사용할 수 있습니다.

    #hostingforum.kr
    php
    
    $html = file_get_contents('example.html');
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
    
    


    이 옵션을 사용하면, HTML 파일의 meta 태그와 불필요한 태그가 제거됩니다.

    2025-05-22 04:02

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 21,597건 / 17 페이지

검색

게시물 검색