개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.03.21 08:12

DOMDocument::loadHTML 관련 질문

목록
  • PWA전도사 20시간 전 2025.03.21 08:12 새글
  • 1
    1
저는 DOMDocument::loadHTML 함수를 사용하여 HTML 문서를 파싱하여 노드 트리를 생성하는 것을 공부하고 있지만, 아래와 같은 문제가 있습니다.

1. HTML 문서에서 특정 태그의 내용을 추출하는 방법을 알고 싶습니다. 예를 들어, HTML 문서에서 `

` 태그의 내용을 추출하는 방법이 뭘까요?
2. HTML 문서에서 특정 태그의 속성을 추출하는 방법을 알고 싶습니다. 예를 들어, HTML 문서에서 `` 태그의 `href` 속성을 추출하는 방법이 뭘까요?
3. HTML 문서에서 특정 노드의 자식 노드를 추출하는 방법을 알고 싶습니다. 예를 들어, HTML 문서에서 `

` 태그의 자식 노드를 추출하는 방법이 뭘까요?

제가 이해한 바로는 `DOMDocument::loadHTML` 함수를 사용하여 HTML 문서를 파싱하여 노드 트리를 생성한 후, 노드 트리를 탐색하여 필요한 정보를 추출하는 것이 가능하다고 생각합니다. 하지만, 실제로 어떻게 해야 하는지 모르겠습니다. 도와주세요!

    댓글목록

    profile_image
    나우호스팅  20시간 전



    1. HTML 문서에서 특정 태그의 내용을 추출하는 방법은 다음과 같습니다.

    #hostingforum.kr
    php
    
    $dom = new DOMDocument();
    
    $dom->loadHTML($html);
    
    $h1_node = $dom->getElementsByTagName('h1')->item(0);
    
    if ($h1_node) {
    
        echo $h1_node->nodeValue;
    
    }
    
    


    2. HTML 문서에서 특정 태그의 속성을 추출하는 방법은 다음과 같습니다.

    #hostingforum.kr
    php
    
    $dom = new DOMDocument();
    
    $dom->loadHTML($html);
    
    $a_node = $dom->getElementsByTagName('a')->item(0);
    
    if ($a_node) {
    
        echo $a_node->getAttribute('href');
    
    }
    
    


    3. HTML 문서에서 특정 노드의 자식 노드를 추출하는 방법은 다음과 같습니다.

    #hostingforum.kr
    php
    
    $dom = new DOMDocument();
    
    $dom->loadHTML($html);
    
    $ul_node = $dom->getElementsByTagName('ul')->item(0);
    
    if ($ul_node) {
    
        foreach ($ul_node->childNodes as $child_node) {
    
            echo $child_node->nodeName . ': ' . $child_node->nodeValue . "n";
    
        }
    
    }
    
    


    이러한 방법으로 노드 트리를 탐색하여 필요한 정보를 추출할 수 있습니다.

    2025-03-21 08:13

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 5,314건 / 12 페이지

검색

게시물 검색