전체 글 47

[JAVA] 환경 변수 설정하기

지난 포스팅에서 Java OpenJDK 1.8 버전을 설치하는 법에 대해 소개하였다. 어떤 버전을 설치하든 설치가 쉽고, 라이선스를 무료로 이용할 수 있기 때문에 OpenJdk 설치를 선호한다. [JAVA OpenJDK 1.8 설치하기] 이번 포스팅에서는 Windows PC에서 JAVA가 설치된 경로를 인식하고, 쉽게 접근할 수 있도록 환경 변수를 하는 방법에 대해 알아보려고 한다. 환경 변수 설정 방법을 바로 알고 싶다면 아래의 링크를 클릭해 이동하자. [환경 변수 설정 방법 바로보기] Java를 정상적으로 설치한 후에도 명령 프롬프트에서 Java의 버전을 확인하는 명령어를 입력해도 위의 이미지와 같은 오류가 발생한다. 기본적으로 명령 프롬프트는 "현재 작업 디렉토리" 내 있는 프로그램을 실행하는데, ..

PC도르 2022.02.09

[JAVA] OpenJDK 1.8 설치

JAVA의 오픈소스 버전인 OpenJDK 1.8 버전을 설치하는 방법에 대해 포스팅 합니다. Oracle Java와 비교하여 OpenJDK는 오픈 소스로 무료로 이용할 수 있습니다. 또한 Oracle Java가 설치 시 로그인을 해야하고 계정 인증을 해야하는데, 이런 번거로운 경험 없이 설치할 수 있습니다. 기존에 제작된 많은 Java 프로그램 그리고 Java 교재에서 사용된 1.8 버전 설치 경로와 과정에 대해 안내드리겠습니다. GitHub - ojdkbuild/ojdkbuild: Community builds using source code from OpenJDK project Community builds using source code from OpenJDK project - GitHub - oj..

PC도르 2022.02.09

파이썬 개발 환경 # Google Colab 과 # Google Drive 연동하기

지난 포스팅에서 파이썬 학습에 좋은 무료 서비스인 구글의 Colaboration을 (Colab, 이하 코랩) 소개했습니다. 코랩은 현재 이용 중인 PC의 사양과 별개로 구글에서 제공하는 무료 서버를 클라우드 방식으로 이용하는 것이기 때문에, 인터넷만 가능하다면 언제 어디서나 파이썬 코드를 작성해 실행할 수 있습니다. 무료 제공 서비스이기에 제한적인 이용만 가능하지만, 제한되는 cpu, gpu, ram 메모리의 성능도 꽤 준수합니다. 따라서 학습 환경에 있어서는 최적이라고 생각합니다. 자세한 정보는 아래의 링크를 통해 지난 포스팅을 확인 바랍니다. 파이썬 개발 환경 # Google Colab 파이썬 개발 환경 # Google Colab 개인적으로 파이썬을 공부하던 중에, 학습 및 개발하기에 유용한 서비스를..

파이썬도르 2021.05.08

02_ 탐색적 데이터 분석 (EDA) - 데이터 시각화 (2)

지난 글에서 분류형 데이터 (Categorical Data) 특성 별로 시각화하여 살펴보았습니다. 전반적으로 데이터 불균형이 확인되었으며, 희소한 데이터도 많아 모델 생성 및 학습 전 이를 해결해야할 것 같습니다. 분류형 데이터의 EDA 및 시각화 01_ 탐색적 데이터 분석 (EDA) - 데이터 시각화 (1) 탐색적 데이터 분석 (Exploratory Data Analysis) 이란 본격적인 모델링을 시작하기 전, 데이터에 대한 인사이트를 얻기 위해 데이터의 종류 및 분포 등을 확인하는 작업입니다. 이 과정을 거침으로서 zngsup.tistory.com 이번 포스팅에서는 수치형 데이터를 (Numeric Data) 시각화해 데이터의 특성을 시각화로 확인합니다. 분류형 데이터와는 다르게 수치형 데이터는 '연..

01_ 탐색적 데이터 분석 (EDA) - 데이터 시각화 (1)

탐색적 데이터 분석 (Exploratory Data Analysis) 이란 본격적인 모델링을 시작하기 전, 데이터에 대한 인사이트를 얻기 위해 데이터의 종류 및 분포 등을 확인하는 작업입니다. 이 과정을 거침으로서 데이터 분석가가 모델링의 목적과 방향을 설정해 시간을 단축하고, 작업성을 높일 수 있습니다. 1. 정량적 분석 훈련 데이터 셋 26,457 rows X ( 18 features + 1 target ) 모델의 타겟은 'credit' 으로, 일종의 신용 등급; 0, 1, 2 로 구분되며 수치가 작을 수록 연체 가능성이 낮다고 판단 평가 데이터 셋 10,000 rows X ( 18 features ) 2. 데이터 특성 설명 이진형 (binary) / 분류형 (category) 특성과 수치형 (num..

00_ 신용카드 사용자 연체 예측 AI 경진대회

데이터 분석가 입문자가 DACON의 경쟁 프로젝트에 참여해 분석한 내용을 기록합니다. 입문한지 두 달되어 코드도 지저분하고, 분석도 다소 부족하지만, 하나의 분석 프로젝트를 AtoZ 해본다는 생각으로 기록할 생각입니다. 부족한 부분에 대한 피드백은 댓글로 남겨주시면 감사드립니다. 신용카드 사용자 연체 예측 AI 경진대회 대회 링크 : https://www.dacon.io/competitions/official/235713/overview/description/ 신용카드 사용자 연체 예측 AI 경진대회 출처 : DACON - Data Science Competition dacon.io 신용카드 사용자 정보를 이용해 신규 가입자의 연체 가능성을 확인하는 알고리즘을 개발하는 프로젝트 입니다. 총 26,457개..

파이썬 개발 환경 # Google Colab

개인적으로 파이썬을 공부하던 중에, 학습 및 개발하기에 유용한 서비스를 소개하려고 합니다. 바로 Google에서 무료로 제공 중인 서비스 'Colaboratory' (이하 코랩) 입니다. 코랩은 인터넷 브라우저에서 가상의 개발 서버에 접속해, 사용자가 언제 어디서든 파이썬으로 개발할 수 있는 환경을 제공합니다. 즉, 장소와 시간에 구애받지 않고 파이썬 프로그래밍을 하고자 한다면 이보다 좋은 서비스는 없을 것 같습니다. 장점 Colab의 개발 환경은 'Jupyter Notebook'을 기반으로 하기 때문에, 이전에 Jupyter 서비스를 사용해본 사람은 익숙할지 모릅니다. Jupyter 서비스 처럼 행별 코드 실행이 가능하고, Markdown 형식의 텍스트 박스도 추가할 수 있습니다. 기본적인 단축키도 모..

파이썬도르 2021.04.24

교차 검증 (Cross Validation) <sklearn.model_selection.cross_validate>

이전 포스팅에서 머신러닝 모델을 객관적으로 평가하기 위해 모델 학습 과정에서 데이터의 분리 필요성에 대해 설파했다.일반적인 데이터 분리에 대해서는 아래의 링크로 이동해 확인할 수 있다. 사이킷런의 함수를 이용해 데이터 분리하기훈련셋과 평가셋 분리 서론 주어진 데이터에 대해 머신 러닝 모델을 만들고 학습시키기 위해서는 우선 데이터를 분리할 필요가 있다. 데이터를 분리하지 않고 학습과 평가에 모두 사용하는 것은, 마치 중간 고사 문제zngsup.tistory.com 이번 포스팅에서는 모델 평가에 좀 더 객관성을 부여하기 위한 데이터 처리 방법인'교차 검증 (Cross Validation)'에 대해 알아봅니다. 서론단어가 주는 의미 그대로 '교차 검증'이란 분리한 데이터를 교차하여 모델을 검증하는 겁니다. 함..

훈련셋과 평가셋 분리 <sklearn.model_selection.train_test_split>

서론주어진 데이터에 대해 머신 러닝 모델을 만들고 학습시키기 위해서는 우선 데이터를 분리할 필요가 있다. 데이터를 분리하지 않고 학습과 평가에 모두 사용하는 것은, 마치 중간 고사 문제를 미리 풀고 시험을 보는 것과 같다.그런 식으로 평가한다면, 모델의 정확도는 분명 높을 것이고, 평가에 대한 객관성도 떨어진다. 또한 이렇게 만들어진 모델은 주어진 데이터데 대한 '과적합 (Overfitting)' 판단이 어려울 수 있다. 따라서 모델을 생성하기 전,주어진 데이터를 학습할 데이터와 (trining set) 평가할 데이터로 (test set) 분리해야한다. 본론사이킷런 라이브러리에는 훈련 데이터와 학습 데이터를 분리해주는 함수가 있다. 이 함수를 이용하면 원본 데이터를 알아서 훈련 세트와 테스트 세트로 나눠..

# 파이썬 # 독학 일기 12 # Codelion [심화] 같이 푸는 파이썬

서문 이번 예제는 라이브러리를 이용한 번역기를 만드는 것 입니다. 번역할 언어를 탐지하고, 탐지한 언어를 원하는 언어로 번역하는 기능을 할 수 있죠. Codelion의 파이썬 심화 과정을 수강하며 드는 생각이 있습니다. 파이썬은 정말 라이브러리를 얼마나 잘 알고 있고, 어떻게 사용하느냐가 중요한 것 같다는 생각이 듭니다. 물론 정확히 쓰기 위해서는 기본 문법을 알고 있어야 겠지만요. 다만, 강의 자체의 내용은 풍부하지는 않습니다. 강사의 팁이라기 보다는 라이브러리의 기능을 조금 포장해서 전달하는 느낌이랄까요? 딱 수강료 65,000원 가격만 하다고 생각합니다. 적어도 라이브러리 사용이 중요하다는 사실을 깨달았으니까요. 제가 앞으로 어떤 프로그램을 작성하던 라이브러리에 대한 기능 파악을 하는게 중요할 것 ..

파이썬도르 2021.03.20