본문 바로가기

python41

[Python] selenium - 대기 개요 동적 웹 페이지를 크롤링할 때, 페이지 일부가 로딩되지 않아 오류가 발생하는 상황을 방지하기 위함. 또한, 페이지 일부가 로딩되기를 기다리는 시간이 30초 이상으로 너무 길어, 많은 수의 페이지를 크롤링하는데 시간이 지나치게 오래 걸리는 것을 해결하고자 함. 1. 동적 웹 페이지의 일부가 로딩될 때까지 대기 단순 시간 대기 : time 라이브러리의 time.sleep() 암묵적 대기 : driver.implicitly_wait() 명시적 대기 : selenium 라이브러리의 WebDriverWait, expected_conditions 두 가지 방법 중에 2번쨰 방법을 추천하는 이유는 time.sleep()은 정해진 시간을 대기한다. 웹페이지가 이미 로딩되었더라도 무조건 대기하게 되고, 정해진 시간.. 2022. 12. 10.
[Python] datetime - 날짜, 시간 1. 현재 시각 datetime.today() import datetime print(datetime.datetime.today()) # 2022-12-08 10:29:26.121961 print(type(datetime.datetime.today())) # datetime.datetime print(datetime.datetime.today().year) # 2022 print(type(datetime.datetime.today().year)) # int 더 많은 속성은 아래 참고 https://docs.python.org/ko/3/library/datetime.html#datetime.datetime.year 2. datetime 객체 생성 datetime() datetime.datetime(year.. 2022. 12. 8.
[Python] time - 시간 1. 현재시각 time.time() import time t = time.time() # 1970년 1월 1일 0시 0분 0초 이후로 경과한 시간을 초 단위로 반환 print(t) print(type(t)) # type: float 2. time 객체 time.localtime() import time # 입력값 없으면 현재 시간이 기본값 print(time.localtime()) # time.struct_time(tm_year=2022, tm_mon=12, tm_mday=8, tm_hour=9, tm_min=54, tm_sec=24, tm_wday=3, tm_yday=342, tm_isdst=0) print(time.localtime(time.time())) # print(type(a)) 3. 출력 포.. 2022. 12. 8.
[Python] xmltodict 개요 xml 형태의 문자열을 dictionary로 바꾸어줌 예제 xmltodict.parse("XML 형태 문자열") # return : dictionary 2022. 12. 6.
[Python] bs4 - find/select 개요 BeautifulSoup4, bs4 find()는 원하는 태그를 찾는데 사용한다. select()는 CSS selector를 이용해 원하는 태그를 찾는데 사용한다. 하위 태그를 찾는데 find() 보다 편리함 find(), find_all() find() : 조건에 해당하는 첫 번째 태그만 가져옴, Tag 객체 반환 soup.find("태그이름") soup.find("태그이름1").find("태그이름2") # 이어서 사용 가능 find_all() : 조건에 해당하는 태그 모두 추출, Resultset 객체 반환 soup.find_all("태그이름") select_one(), select() select_one() : 조건에 해당하는 첫 번째 태그만 가져옴 select() : 조건에 해당하는 태그 모.. 2022. 12. 6.