python/웹크롤링
[Python] bs4 - find/select
wjwkddyd221001
2022. 12. 6. 23:02
개요
BeautifulSoup4, bs4
find()는 원하는 태그를 찾는데 사용한다.
select()는 CSS selector를 이용해 원하는 태그를 찾는데 사용한다. 하위 태그를 찾는데 find() 보다 편리함
find(), find_all()
find() : 조건에 해당하는 첫 번째 태그만 가져옴, Tag 객체 반환
- soup.find("태그이름")
- soup.find("태그이름1").find("태그이름2") # 이어서 사용 가능
find_all() : 조건에 해당하는 태그 모두 추출, Resultset 객체 반환
- soup.find_all("태그이름")
select_one(), select()
select_one() : 조건에 해당하는 첫 번째 태그만 가져옴
select() : 조건에 해당하는 태그 모두 추출
- select("태그이름")
- select("상위태그>중간태그> 하위태그")
- select(".클래스명")
- select("상위태그.클래스명>하위태그.클래스명")
- select("#아이디명")
- select("태그명[속성]")