상세 컨텐츠

본문 제목

[PYTHON] &[Web Scraping] BeautifulSoup - 실시간 검색어 20개 가져오기

1 a n G u a g e /PYTHON

by 동혼 2019. 8. 26. 07:06

본문

 

 

실시간 검색어 가져오기

  • 주소 가져와서 url 변수에 저장
  • res 변수에 주소에서 가져온 것을저장하면
  • res.text 로 내용 확인 가능 
  • soup 에 res.text 를 넣어 html 파일로 만들기

---

 Sol 1 ) ul 태그의  ah_l  클레스 이용 

  • soup 에 저장한 형태에서 찾을 내용을 find 로 찾기
  • ul 태그에 있는 ah_l 클레스를 가져올 예정
  • 여러개가 있기에 한 변수에 담고
  • 이를 리스트에 담기위해 엔터(=\n) 기준으로 split(잘라서) 저장한 후
  • 반복문을 돌려 엔터를 제외시킨다 ( = del[content] )
  •  
  • 숫자 이외에 실시간 검색어 순위 20 text 만 가져오기 위하여
  • 반복문을 돌리고 인덱스가 홀수 인 것만 print 한다
  • 앞에 넘버를 붙여서 몇개 나오는 지 확인하기

---

 Sol 2 ) span 태그

  • ul이랑 달리 span 태그일경우 여러개라서 모두 가져올 수 있는 select 를 사용한다
  • 20개만 가져오기위해 limit=20 개로 제한한다
  • 반복문을 돌려서 리스트에 있는 내용을 원하는 형태로 format 한다
  • 리스트의 길이만큼 반복 / 리스트의 내용을 .text 로 꺼냄 / 형태는 1. 내용 으로 시킴

 

 

 

 

 

 

 

 

 

 Sol 1 ) ul 태그의  ah_l  클레스 이용

 

 

 

 

 

 

 

Sol 2 ) span 태그

 

 

 

 

 

 

 

관련글 더보기

댓글 영역