파이썬 7

교차 검증 (Cross Validation) <sklearn.model_selection.cross_validate>

이전 포스팅에서 머신러닝 모델을 객관적으로 평가하기 위해 모델 학습 과정에서 데이터의 분리 필요성에 대해 설파했다.일반적인 데이터 분리에 대해서는 아래의 링크로 이동해 확인할 수 있다. 사이킷런의 함수를 이용해 데이터 분리하기훈련셋과 평가셋 분리 서론 주어진 데이터에 대해 머신 러닝 모델을 만들고 학습시키기 위해서는 우선 데이터를 분리할 필요가 있다. 데이터를 분리하지 않고 학습과 평가에 모두 사용하는 것은, 마치 중간 고사 문제zngsup.tistory.com 이번 포스팅에서는 모델 평가에 좀 더 객관성을 부여하기 위한 데이터 처리 방법인'교차 검증 (Cross Validation)'에 대해 알아봅니다. 서론단어가 주는 의미 그대로 '교차 검증'이란 분리한 데이터를 교차하여 모델을 검증하는 겁니다. 함..

훈련셋과 평가셋 분리 <sklearn.model_selection.train_test_split>

서론주어진 데이터에 대해 머신 러닝 모델을 만들고 학습시키기 위해서는 우선 데이터를 분리할 필요가 있다. 데이터를 분리하지 않고 학습과 평가에 모두 사용하는 것은, 마치 중간 고사 문제를 미리 풀고 시험을 보는 것과 같다.그런 식으로 평가한다면, 모델의 정확도는 분명 높을 것이고, 평가에 대한 객관성도 떨어진다. 또한 이렇게 만들어진 모델은 주어진 데이터데 대한 '과적합 (Overfitting)' 판단이 어려울 수 있다. 따라서 모델을 생성하기 전,주어진 데이터를 학습할 데이터와 (trining set) 평가할 데이터로 (test set) 분리해야한다. 본론사이킷런 라이브러리에는 훈련 데이터와 학습 데이터를 분리해주는 함수가 있다. 이 함수를 이용하면 원본 데이터를 알아서 훈련 세트와 테스트 세트로 나눠..

# 파이썬 # 독학 일기 12 # Codelion [심화] 같이 푸는 파이썬

서문 이번 예제는 라이브러리를 이용한 번역기를 만드는 것 입니다. 번역할 언어를 탐지하고, 탐지한 언어를 원하는 언어로 번역하는 기능을 할 수 있죠. Codelion의 파이썬 심화 과정을 수강하며 드는 생각이 있습니다. 파이썬은 정말 라이브러리를 얼마나 잘 알고 있고, 어떻게 사용하느냐가 중요한 것 같다는 생각이 듭니다. 물론 정확히 쓰기 위해서는 기본 문법을 알고 있어야 겠지만요. 다만, 강의 자체의 내용은 풍부하지는 않습니다. 강사의 팁이라기 보다는 라이브러리의 기능을 조금 포장해서 전달하는 느낌이랄까요? 딱 수강료 65,000원 가격만 하다고 생각합니다. 적어도 라이브러리 사용이 중요하다는 사실을 깨달았으니까요. 제가 앞으로 어떤 프로그램을 작성하던 라이브러리에 대한 기능 파악을 하는게 중요할 것 ..

파이썬도르 2021.03.20

# 파이썬 # 독학 일기 11 # Codelion [심화] 같이 푸는 파이썬

서문 다른 사람에 의해 만들어진 모듈을 불러와 내 프로그램에서 기능을 이용할 수 있습니다. 지난 시간에는 '웹 사이트에 정보를 요청'하는 모듈과 '텍스트 Parsing 기능'을 도와주는 모듈을 다운로드 받아 이용했습니다. 이번 예제에서는 'API (Application Programming Interface)'를 이용해 날씨 정보를 가져와 확인하는 프로그램을 작성해보겠습니다. 전체 코드 # 와 모듈의 기능이 필요한 작업입니다. # 모듈은 java script의 형태로 가져온 API의 정보를 제대로 읽기 위한 모듈입니다. 구문 해석 # API를 이용하기 위해서는 Key가 필요합니다. Key는 API를 제공하는 업체에서 유저에게 부여하는 접근 권한 코드라고 생각하시면 됩니다. # API를 제공..

파이썬도르 2021.03.19

# 파이썬 # 독학 일기 10 # Codelion [심화] 같이 푸는 파이썬

서문 나도코딩 유튜브를 영상을 통해 파이썬의 기본 문법을 학습했다고 생각합니다. 문법을 한 번 배운 것으로 완벽할 순 없겠지만, 실제 프로그래밍을 작성해보며 익혀보려고 합니다. 단, 아직까지 파이썬으로 어떤 프로그램을 작성할 수 있는지 와닿지는 않는 것 같습니다. 인터넷에서 도움되는 자료를 찾던 중 Codelion이라는 프로그래밍 교육 사이트를 발견했습니다. 문법 작성 보다는 실제 이용되는 기능들을 알아보고 그것들을 이용해 프로그램을 작성해보기 위해 [심화] 과정을 수강하였습니다. 수강한 내용을 복습한다는 의미로 글을 작성하게 되었습니다. 참고로 Codelion 서비스는 방송으로 잘 알려진 프로그래머 이두희씨가 만든 프로그래밍 교육기관인 '멋쟁이사자처럼' 이라는 회사가 만든 온라인 코딩 교육 서비스라고 ..

파이썬도르 2021.03.18

# 프로그래밍 # 독학 일기 09 # 파이썬 _ 나도코딩 퀴즈 풀이

나도코딩님의 파이썬 기초 학습영상의 마지막 퀴즈입니다. 모듈을 작성하여 다른 프로그램에서 작성한 모듈을 불러오는 내용의 학습이 필요합니다. 하나의 프로그램에 모든 기능을 정의한다면 작성된 파일은 굉장히 복잡해질 것입니다. 반복적으로 사용되는 기능들은 '모듈'이라는 형태로 별도 저장하여 해당 기능을 이용할 때만 불러올 수 있다면 참 편리하겠지요. 편리하게도 파이썬은 이러한 기능을 제공하고 있습니다. 이를 학습하여 영리하게 프로그램을 작성해봅시다. 나도코딩 유튜브 영상 : 파이썬 코딩 무료 강의 (기본편) - 6시간 뒤면 여러분도 개발자가 될 수 있어요 [나도코딩] Quiz # 프로젝트 내 시그니쳐를 남기는 모듈을 만드시오. # 조건 : 모듈 파일명은 byme.py로 작성 # (모듈 사용 예제) import..

파이썬도르 2021.03.17

# 프로그래밍 # 독학 일기 06 # 파이썬 _ 나도코딩 퀴즈 풀이

이번 퀴즈에서는 파이썬을 이용해 파일을 입출력하는 방법에 대해 알아보겠습니다. 지금까지 배운 개념들 중 가장 실용적이라고 느꼈던 것은 업무 자동화와 관련있었기 때문입니다. 이 개념을 응용한다면 같은 형식의 반복적인 업무를 간단하게 처리할 수 있다고 생각합니다. 유튜브 강의를 학습하시고 편-안한 직장생활 영위하세요! 나도코딩 유튜브 영상 : 파이썬 코딩 무료 강의 (기본편) - 6시간 뒤면 여러분도 개발자가 될 수 있어요 [나도코딩] Quiz # 매주 1회 내용을 입력받아 보고서를 작성합니다. # (프로그램 출력 예시) - X 주차 주간 보고 - 부서 : 이름 : 업무 요약 : # 1주차부터 50주차까지의 보고서 파일을 만드는 프로그램을 작성하시오 # 조건 : 파일명은 '1주차.txt', '2주차.txt'..

파이썬도르 2021.03.14