본문 바로가기
python/웹크롤링

[Python] requests - text와 content의 차이

by wjwkddyd221001 2023. 5. 28.

Code

import requests

url = ''
response = requests.get(url)

response.text
response.content

 

text

수신한 HTML 정보를 디코딩하여 화면에 표시

 

content

  • 수신한 HTML 정보를 바이트정보로 표시
  • ASCII(알파벳)은 1바이트이므로 그대로 출력되지만, 2바이트인 한글은 깨져서 보임
  • BeautifulSoup와 같이 사용하려면 다음과 같이 content를 사용해서 넘겨주기
from bs4 import BeautifulSoup

soup = BeautifulSoup(response.content, "html.parser")

 

  • 깨진 한글 디코딩하는 법
 # 디코딩하는 법
 a = '깨진 한글'
 print(a.decode("utf-8"))

 

참고자료

https://marisara.tistory.com/entry/파이썬-requests-2-text와-content

'python > 웹크롤링' 카테고리의 다른 글

[Python] bs4 - get_text(), string  (0) 2023.05.28
[Python] selenium - 웹페이지 html 가져오기  (0) 2022.12.11
[Python] selenium - 대기  (0) 2022.12.10
[Python] bs4 - find/select  (0) 2022.12.06