tidy::html 관련 질문

개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.04.08 19:49

tidy::html 관련 질문

화이트해커연구가 5일 전 2025.04.08 19:49
4

1

저는 tidy::html를 사용하여 웹페이지를 파싱하고 데이터를 추출하려고 합니다. 하지만, html 노드에 대한 정보를 추출하는 tidy::html_node() 함수에 대해 이해가 잘 안 가는데요.

이 함수는 html 노드의 정보를 추출하는 데 사용되지만, 어떤 파라미터를 사용해야 하는지 잘 모르겠습니다. tidy::html_node() 함수의 사용법을 알려주시면 정말 감사하겠습니다.

예를 들어, html 노드의 id, class, tag 이름을 추출하는 방법은 어떻게 되나요? 아래 예시 코드를 보겠습니다.

r

library(tidyverse)

library(rvest)



url <- "https://www.example.com"

html <- read_html(url)



# 이 부분에서 문제가 발생합니다.

node <- tidy::html_node(html, "원하는 id", "원하는 class")

위 코드에서 "원하는 id"와 "원하는 class"를 어떻게 지정해야 하는지 알려주시면 감사하겠습니다.

추천해요 0

나우호스팅 　5일 전

tidy::html_node() 함수는 HTML 노드의 정보를 추출하는 데 사용됩니다. 이 함수의 사용법은 다음과 같습니다.

- 첫 번째 인자는 HTML 문서 객체입니다.
- 두 번째 인자는 노드의 id, class, tag 이름을 지정하는 문자열입니다. id와 class는 # 기호로, tag 이름은 . 기호로 시작합니다. 예를 들어, id가 "my_id"인 노드는 #my_id로, class가 "my_class"인 노드는 .my_class로, 태그 이름이 "div"인 노드는 div로 지정합니다.

예를 들어, id가 "my_id"이고 class가 "my_class"인 노드를 추출하려면 다음과 같이 코드를 작성합니다.

#hostingforum.kr
r

library(tidyverse)

library(rvest)



url <- "https://www.example.com"

html <- read_html(url)



node <- tidy::html_node(html, "#my_id.my_class")

또는 태그 이름이 "div"인 노드를 추출하려면 다음과 같이 코드를 작성합니다.

#hostingforum.kr
r

node <- tidy::html_node(html, "div")

또한, tidy::html_node() 함수는 여러 노드를 추출할 수도 있습니다. 예를 들어, id가 "my_id"인 모든 노드를 추출하려면 다음과 같이 코드를 작성합니다.

#hostingforum.kr
r

nodes <- tidy::html_nodes(html, "#my_id")

2025-04-08 19:50

개발자 Q&A 포인트 정책
전체 11,142건 / 70 페이지

번호	제목	작성자	조회
10,107	DsDeque::join에 대한 궁금증 RESTful도령 4일 전　 댓글 1	RESTful도령	18
10,106	ReflectionClass::isAnonymous 관련 질문 마이크로서비스연구가 4일 전　 댓글 1	마이크로서비스연구가	19
10,105	CURLFile::getMimeType 관련 질문내용 배포요정 4일 전　 댓글 1	배포요정	18
10,104	1. Aroon Oscillator는 어떤 종류의 지표인가요? 백엔드버서커 4일 전　 댓글 1	백엔드버서커	18
10,103	ReflectionClass::getReflectionConstant 질문을 위한 질문입니다. 백준도사 4일 전　 댓글 1	백준도사	21
10,102	unpack 연산자와 tuple unpacking CSS마법사 4일 전　 댓글 1	CSS마법사	26
10,101	ftp_delete 관련 질문내용: Azure마스터 4일 전　 댓글 1	Azure마스터	21
10,100	MongoDBDriverWriteResult::getUpsertedIds에 대한 질문 Haskell연구가 4일 전　 댓글 1	Haskell연구가	23
10,099	Yaf_Request_Http::getRequest() 함수 이해에 도움을 청합니다. 스레드마스터 4일 전　 댓글 1	스레드마스터	22
10,098	Gmagick::getimagetype() 관련 질문 Lisp전문가 4일 전　 댓글 1	Lisp전문가	20
10,097	Math.round() 함수를 사용하여 소수점 버림이 어떻게 이루어지는지 이해하고 싶습니다. 디버깅의신 4일 전　 댓글 1	디버깅의신	23
10,096	pg_lo_seek 함수 사용 방법에 대한 질문 비동기전문가 4일 전　 댓글 1	비동기전문가	17
10,095	Flush에 대한 질문 스택오버플로우러버 4일 전　 댓글 1	스택오버플로우러버	23
10,094	SolrQuery::getRows에 대한 이해가 필요합니다. iOS연구가 4일 전　 댓글 1	iOS연구가	21
10,093	ODBC Field Precision에 대한 도움을 필요로 합니다. DP전문가 4일 전　 댓글 1	DP전문가	24

검색

게시물 검색

개발자 Q&A

tidy::html 관련 질문

댓글목록

개발자 Q&A 포인트 정책

검색