Python

Python/seaborn, matplotlib

matplotlib, seaborn에서 한글 폰트 사용하기

예제 데이터는 데이콘 대회 중 '감귤 착과량 예측 AI경진대회'의 train 데이터셋 이용 In [1]: import pandas as pd gyul_train_df = pd.read_csv('./jeju_mandarin/train.csv') In [2]: gyul_growth = gyul_train_df[['착과량(int)', '수고(m)', '수관폭1(min)', '수관폭2(max)', '수관폭평균']] gyul_growth Out[2]: 착과량(int) 수고(m) 수관폭1(min) 수관폭2(max) 수관폭평균 0 692 275.0 287.0 292.0 289.5 1 534 293.0 284.0 336.0 310.0 2 634 300.0 392.0 450.0 421.0 3 639 289.0 368.0..

Python/Numpy

넘파이 numpy (4) - random 모듈(rand, randint, randn, choice, seed, etc)

참고: https://codetorial.net/numpy/random.html NumPy 난수 생성 (Random 모듈) - Codetorial 예제1 - 기본 사용 import numpy as np a = np.random.randn(5) print(a) b = np.random.randn(2, 3) print(b) sigma, mu = 1.5, 2.0 c = sigma * np.random.randn(5) + mu print(c) [ 0.06704336 -0.48813686 0.4275107 -0.9015714 -1.30597604] [[ 0.87354043 0.03783 codetorial.net numpy의 서브모듈: random 모듈¶ random은 난수를 발생시키는 모듈로 randint, c..

Python/Pandas

판다스 pandas (8) - unique(), nunique()

데이터 분석하다가 유일값 찾고 싶을 때 예제데이터는 데이콘 대회 중 이미 끝난 '제주도 도로 교통량 예측 AI 경진대회'에서 가져왔다. https://dacon.io/competitions/official/235985/data 제주도 도로 교통량 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io train = pd.read_csv('./jeju_traffic/train.csv') test = pd.read_csv('./jeju_traffic/test.csv') train 1. unique( ) - 데이터에 고유값들이 어떠한 종류들이 있는지 알고 싶을때 사용하는 함수 도로의 차량 평균 속도와 상관있을 것 같은 피처들 살펴보기 pr..

Python/Pandas

판다스 pandas (7) - lambda, apply, map

apply lambda 식으로 데이터 가공¶ 칼럼에 일괄적으로 데이터 가공을 하는 것이 속도 면에서 빠르고 복잡한 데이터 가공이 필요할 경우 이용 In [2]: def get_square(a): return a**2 print('3의 제곱은:', get_square(3)) 3의 제곱은: 9 lambda는 이런 함수 선언과 함수 내의 처리를 한 줄의 식으로 쉽게 변환하는 식임 : 로 입력 인자와 반환될 입력 인자의 계산식(반환값)을 분리함 여러 개의 값을 입력 인자로 사용해야 할 때, map( )함수과 같이 씀 In [3]: lambda_square = lambda x : x ** 2 print('3의 제곱은:', lambda_square(3)) 3의 제곱은: 9 In [5]: a = [1, 2, 3] s..

Python/Pandas

판다스 pandas (6) - isna( ), fillna( )

결손 데이터 처리하기¶ 머신러닝은 NaN 값을 처리하지 않으므로 다른 값으로 대체해야 함 결손 여부 확인: isna( ) 다른 값으로 대체: fillna( ) In [1]: import pandas as pd titanic_df = pd.read_csv('./titanic_train.csv') titanic_df Out[1]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female ..

Python/Pandas

판다스 pandas (5) - aggregation, groupby

정렬, Aggregation 함수, GroupBy 적용¶ sort_values( )¶ 주요 파라미터: by='칼럼명', ascending=True(기본 오름차순), inplace=False(호출한 df는 그대로 유지하면서 정렬된 df를 결과로 반환) In [1]: import pandas as pd titanic_df = pd.read_csv('./titanic_train.csv') titanic_df Out[1]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cuming..

얆생
'Python' 카테고리의 글 목록 (2 Page)