본문 바로가기

python41

[Python] bs4 - get_text(), string 개요 BeautifulSoup4, bs4 get_text(), string 모두 태그 내부의 문자열을 얻는데 사용된다. 문자열이 없는 경우 차이가 있다. get_text(), string get_text(): 태그 지우고 문자열 반환 soup.find("태그이름1").find("태그이름2").get_text() string soup.find("태그이름").string get_text()와 string 차이 get_text(): 문자열 없으면 빈 칸 출력 string : 문자열 없으면 None 출력 2023. 5. 28.
[Python] requests - text와 content의 차이 Code import requests url = '' response = requests.get(url) response.text response.content text 수신한 HTML 정보를 디코딩하여 화면에 표시 content 수신한 HTML 정보를 바이트정보로 표시 ASCII(알파벳)은 1바이트이므로 그대로 출력되지만, 2바이트인 한글은 깨져서 보임 BeautifulSoup와 같이 사용하려면 다음과 같이 content를 사용해서 넘겨주기 from bs4 import BeautifulSoup soup = BeautifulSoup(response.content, "html.parser") 깨진 한글 디코딩하는 법 # 디코딩하는 법 a = '깨진 한글' print(a.decode("utf-8")) 참고자.. 2023. 5. 28.
[Python] string 모듈 - 문자 상수 개요 string모듈은 문자 상수를 포함하고 있는 모듈이다. string 모듈 string.ascii_letters ascii_lowercase + ascii_uppercase string.ascii_lowercase : 알파벳 소문자 string.ascii_uppercase : 알파벳 대문자 string.digits : 십진수 숫자(0~9) string.hexdigits : 16진수 숫자(0~F) string.octdigits : 8진수 숫자(0~7) string.punctuation string.whitespace string.printable digit + ascii_letter + puctuation + whitespace 예시 import string print(string.ascii_lower.. 2023. 2. 12.
[Python] sorted() 개요 내장함수 sorted()는 리스트, 딕셔너리를 오름차순 혹은 내림차순으로 정렬할 수 있다. sorted() sorted(정렬할 데이터, key, reverse) Parameters key reverse reverse = False(기본값) # 오름차순 reverse = True # 내림차순 return 값 : list 예제 dictionary의 value를 기준으로 정렬 dic = { "c":3, "a":1, "b":2, "z":26, } result = sorted(dic.items(), key = lambda x : x[1]) print(result) # [('a', 1), ('b', 2), ('c', 3), ('z', 26)] print(dict(result)) # {'a': 1, 'b': 2.. 2023. 2. 11.
[Python] 최소공배수, 최대공약수 최소공배수 lcm, least common multiple import math math.lcm(a, b) 최대공약수 gcd, greatest common divisor import math math.gcd(a, b) 2023. 2. 10.