개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.07.14 20:21

DOMDocument::loadHTMLFile() 관련 질문

목록
  • Scala마법사 2일 전 2025.07.14 20:21
  • 18
    1
제가 현재 HTML 파일을 파싱하여 데이터를 추출하려고하는데, DOMDocument::loadHTMLFile() 함수를 사용 중인데요. 이 함수는 HTML 파일을 파싱할 때, 특정 태그를 무시하거나 제거하는 방법이 있을까요?

예를 들어, HTML 파일에 script 태그가 있지만, 파싱 결과에 포함시키고 싶지 않은 경우에 대해 알려주세요.

또한, loadHTMLFile() 함수가 HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법에 대해 알려주세요.

감사합니다.

    댓글목록

    profile_image
    나우호스팅  2일 전



    DOMDocument::loadHTMLFile() 함수는 HTML 파일을 파싱할 때, 특정 태그를 무시하거나 제거하는 방법은 다음과 같습니다.

    1. 태그를 무시하는 방법: DOMDocument::loadHTMLFile() 함수를 사용할 때, HTML 파일의 태그를 무시하고 싶을 때는 DOMDocument 객체의 loadHTML() 함수 대신 loadHTMLFile() 함수를 사용하는 대신, DOMDocument 객체의 loadHTML() 함수를 사용하고, HTML 파일의 태그를 무시하고 싶은 부분을 태그로 감싸서 무시할 수 있습니다. 예를 들어, HTML 파일에 script 태그가 있지만, 파싱 결과에 포함시키고 싶지 않은 경우에 대해 알려면, script 태그를 무시하고 싶은 부분을 태그로 감싸면 됩니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html);
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    2. 태그를 제거하는 방법: DOMDocument::loadHTMLFile() 함수를 사용할 때, HTML 파일의 태그를 제거하고 싶을 때는 DOMDocument 객체의 loadHTML() 함수 대신 loadHTMLFile() 함수를 사용하는 대신, DOMDocument 객체의 loadHTML() 함수를 사용하고, HTML 파일의 태그를 제거하고 싶은 부분을 태그로 감싸서 제거할 수 있습니다. 예를 들어, HTML 파일에 script 태그가 있지만, 파싱 결과에 포함시키고 싶지 않은 경우에 대해 알려면, script 태그를 제거하고 싶은 부분을 태그로 감싸면 됩니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html);
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    3. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류나 잘못된 형식의 태그를 무시하고, HTML 파일을 파싱합니다. 하지만, DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않기 때문에, HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키고 싶다면, DOMDocument::loadHTMLFile() 함수 대신 DOMDocument::loadHTML() 함수를 사용하는 것을 추천합니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html);
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    4. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류나 잘못된 형식의 태그를 무시하고, HTML 파일을 파싱합니다. 하지만, DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않기 때문에, HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키고 싶다면, DOMDocument::loadHTMLFile() 함수 대신 DOMDocument::loadHTML() 함수를 사용하는 것을 추천합니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    libxml_use_internal_errors(true);
    
    $doc->loadHTML($html);
    
    libxml_clear_errors();
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    5. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류나 잘못된 형식의 태그를 무시하고, HTML 파일을 파싱합니다. 하지만, DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않기 때문에, HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키고 싶다면, DOMDocument::loadHTMLFile() 함수 대신 DOMDocument::loadHTML() 함수를 사용하는 것을 추천합니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html);
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    6. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류나 잘못된 형식의 태그를 무시하고, HTML 파일을 파싱합니다. 하지만, DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않기 때문에, HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키고 싶다면, DOMDocument::loadHTMLFile() 함수 대신 DOMDocument::loadHTML() 함수를 사용하는 것을 추천합니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    libxml_use_internal_errors(true);
    
    $doc->loadHTML($html);
    
    libxml_clear_errors();
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    7. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류나 잘못된 형식의 태그를 무시하고, HTML 파일을 파싱합니다. 하지만, DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않기 때문에, HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키고 싶다면, DOMDocument::loadHTMLFile() 함수 대신 DOMDocument::loadHTML() 함수를 사용하는 것을 추천합니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    $doc->loadHTML($html);
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    8. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류나 잘못된 형식의 태그를 무시하고, HTML 파일을 파싱합니다. 하지만, DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않기 때문에, HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키고 싶다면, DOMDocument::loadHTMLFile() 함수 대신 DOMDocument::loadHTML() 함수를 사용하는 것을 추천합니다.

    #hostingforum.kr
    php
    
    $html = '';
    
    $doc = new DOMDocument();
    
    libxml_use_internal_errors(true);
    
    $doc->loadHTML($html);
    
    libxml_clear_errors();
    
    $xpath = new DOMXPath($doc);
    
    $script_tags = $xpath->query('//script');
    
    foreach ($script_tags as $tag) {
    
        $tag->parentNode->removeChild($tag);
    
    }
    
    


    9. HTML 파일의 오류나 잘못된 형식의 태그를 처리하는 방법: DOMDocument::loadHTMLFile() 함수는 HTML 파일의 오류나 잘못된 형식의 태그를 처리할 때, 에러를 발생시키지 않고, 오류

    2025-07-14 20:22

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 36,447건 / 10 페이지

검색

게시물 검색