개요
BeautifulSoup4, bs4
find()는 원하는 태그를 찾는데 사용한다.
select()는 CSS selector를 이용해 원하는 태그를 찾는데 사용한다. 하위 태그를 찾는데 find() 보다 편리함
find(), find_all()
find() : 조건에 해당하는 첫 번째 태그만 가져옴, Tag 객체 반환
- soup.find("태그이름")
- soup.find("태그이름1").find("태그이름2") # 이어서 사용 가능
find_all() : 조건에 해당하는 태그 모두 추출, Resultset 객체 반환
- soup.find_all("태그이름")
select_one(), select()
select_one() : 조건에 해당하는 첫 번째 태그만 가져옴
select() : 조건에 해당하는 태그 모두 추출
- select("태그이름")
- select("상위태그>중간태그> 하위태그")
- select(".클래스명")
- select("상위태그.클래스명>하위태그.클래스명")
- select("#아이디명")
- select("태그명[속성]")
참고자료
'python > 웹크롤링' 카테고리의 다른 글
[Python] bs4 - get_text(), string (0) | 2023.05.28 |
---|---|
[Python] requests - text와 content의 차이 (0) | 2023.05.28 |
[Python] selenium - 웹페이지 html 가져오기 (0) | 2022.12.11 |
[Python] selenium - 대기 (0) | 2022.12.10 |