Code
import requests
url = ''
response = requests.get(url)
response.text
response.content
text
수신한 HTML 정보를 디코딩하여 화면에 표시
content
- 수신한 HTML 정보를 바이트정보로 표시
- ASCII(알파벳)은 1바이트이므로 그대로 출력되지만, 2바이트인 한글은 깨져서 보임
- BeautifulSoup와 같이 사용하려면 다음과 같이 content를 사용해서 넘겨주기
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.content, "html.parser")
- 깨진 한글 디코딩하는 법
# 디코딩하는 법
a = '깨진 한글'
print(a.decode("utf-8"))
참고자료
https://marisara.tistory.com/entry/파이썬-requests-2-text와-content
'python > 웹크롤링' 카테고리의 다른 글
[Python] bs4 - get_text(), string (0) | 2023.05.28 |
---|---|
[Python] selenium - 웹페이지 html 가져오기 (0) | 2022.12.11 |
[Python] selenium - 대기 (0) | 2022.12.10 |
[Python] bs4 - find/select (0) | 2022.12.06 |