파이썬도르

# 파이썬 # 독학 일기 10 # Codelion [심화] 같이 푸는 파이썬

이군 2021. 3. 18. 10:10
반응형
서문

나도코딩 유튜브를 영상을 통해 파이썬의 기본 문법을 학습했다고 생각합니다. 문법을 한 번 배운 것으로 완벽할 순 없겠지만, 실제 프로그래밍을 작성해보며 익혀보려고 합니다. 단, 아직까지 파이썬으로 어떤 프로그램을 작성할 수 있는지 와닿지는 않는 것 같습니다.

 

인터넷에서 도움되는 자료를 찾던 중 Codelion이라는 프로그래밍 교육 사이트를 발견했습니다. 문법 작성 보다는 실제 이용되는 기능들을 알아보고 그것들을 이용해 프로그램을 작성해보기 위해 [심화] 과정을 수강하였습니다. 수강한 내용을 복습한다는 의미로 글을 작성하게 되었습니다. 

 

참고로 Codelion 서비스는 방송으로 잘 알려진 프로그래머 이두희씨가 만든 프로그래밍 교육기관인 '멋쟁이사자처럼' 이라는 회사가 만든 온라인 코딩 교육 서비스라고 합니다. 제가 협찬이나 광고를 받은 것은 아니나, 온라인 강의를 찾아볼 때 아무래도 이런 정보를 접하니 신뢰가 갔다고 할까요? 그래서 소개합니다.

 

www.codelion.net/

 

코드라이언 | 손으로 하는 진짜 코딩

멋쟁이사자처럼이 만든 온라인 코딩 교육 서비스 코드라이언, 이제 눈으로만 공부하지 말고 손으로 진짜 코딩 공부를 시작해보세요!

www.codelion.net


전체 코드

# 심화 과정에서는 문법보다는 외부 모듈의 기능을 소개하는 방법으로 강의가 진행됩니다.

# 필요 시 모듈을 작성해 불러올 수 있고, 혹은 다른 사람이 만들어 둔 모듈을 다운로드하여 불러올 수 (<Import>) 있습니다.

 

 

구문 해석

1. <requests> 모듈

# 단어 그대로 정보를 '요청'하는 모듈입니다. 외부 모듈로 설치와 <import>를 통해 불러와야 합니다.

# <requests.get("url")> get 함수를 이용하면 url로 연결되는 웹사이트의 정보를 가져올 수 있습니다.

# 가져온 정보는 모듈의 'Response' 객체로 저장되며, 이는 <.text>로 str 형태로 불러올 수 있습니다.

 

 

# str 형태의 자료를 파일에 기록하여 어떤 형태를 가지고 있는지 확인합니다. 웹 사이트 정보는 html로 이루어져 있습니다.

# html 파일을 분석하여 원하는 정보가 (인기 검색어) 어디에 있는지 확인합니다. 위치 정보는 정보를 포함한 '태그'와 '클래스' 등을 이용해 확인할 수 있습니다.

 

 

2. <BeautifulSoup> 모듈

# 이 모듈은 str 형태로 저장된 웹 사이트 정보를 'Parsing (분해하여 해석)' 하기 위한 기능을 제공합니다.

# 분석할 str 데이터가 html 형식이므로 'html.parser'를 불러옵니다. 

 

 

# 다음 사이트의 '인기 검색어' 정보는 "a" 태그와 "link_favorsch" 클래스를 가지고 있습니다.

# <findAll> 함수를 이용해 원하는 정보를 가져옵니다.

# 리스트에는 인기 검색어 정보 외에도 위치 정보 등이 함께 포함되어 있습니다.

 

 

# 현재 날짜를 가져오는 datetime 모듈을 불러와, 오늘 날짜의 다음 웹 사이트의 인기 검색어를 파일로 출력합니다.

# <get_text()> 함수를 이용하면, 복잡한 태그 정보를 제외한 텍스트 정보만 가져올 수 있습니다.

 

 

결과 출력

Terminal

Exported File

 

응용

# 네이버 인기 검색어의 경우 특별한 과정이 더 필요합니다. 왜인지 headers를 입력하고도 제 프로그램에서는 접근이 불가하다고 나타나 이후 확인을 해봐야 할 것 같습니다.

# 해보고 싶은 작업이 웹 크롤링 기능이 필요할 것 같습니다. 추후 포스트에 다뤄보겠습니다.

 

반응형