Python

Python/Numpy

넘파이 numpy (5) - concatenate(), 배열 합치기

concatenate 메소드, 배열 합치기 concatenate 메소드는 선택한 축 (axis)의 방향으로 배열을 연결해주는 메소드 1) 1차원 배열 In [2]: import numpy as np a1 = np.array([1, 2, 3]) b1 = np.array([4, 5, 6]) print(a1) print(b1) [1 2 3] [4 5 6] In [4]: #1차원 배열에 concanate 적용하기 np.concatenate((a1, b1), axis=0) Out[4]: array([1, 2, 3, 4, 5, 6]) 1차원에서 axis=0은 행방향이나 열방향이라는 개념이 없음 axis=1로 하면 에러 발생 >> 방향이 axis=0 하나 뿐이기 때문(직선이라고 생각) 2) 2차원 배열 In [5]:..

Python/seaborn, matplotlib

matplotlib, seaborn에서 한글 폰트 사용하기

예제 데이터는 데이콘 대회 중 '감귤 착과량 예측 AI경진대회'의 train 데이터셋 이용 In [1]: import pandas as pd gyul_train_df = pd.read_csv('./jeju_mandarin/train.csv') In [2]: gyul_growth = gyul_train_df[['착과량(int)', '수고(m)', '수관폭1(min)', '수관폭2(max)', '수관폭평균']] gyul_growth Out[2]: 착과량(int) 수고(m) 수관폭1(min) 수관폭2(max) 수관폭평균 0 692 275.0 287.0 292.0 289.5 1 534 293.0 284.0 336.0 310.0 2 634 300.0 392.0 450.0 421.0 3 639 289.0 368.0..

Python/Numpy

넘파이 numpy (4) - random 모듈(rand, randint, randn, choice, seed, etc)

참고: https://codetorial.net/numpy/random.html NumPy 난수 생성 (Random 모듈) - Codetorial 예제1 - 기본 사용 import numpy as np a = np.random.randn(5) print(a) b = np.random.randn(2, 3) print(b) sigma, mu = 1.5, 2.0 c = sigma * np.random.randn(5) + mu print(c) [ 0.06704336 -0.48813686 0.4275107 -0.9015714 -1.30597604] [[ 0.87354043 0.03783 codetorial.net numpy의 서브모듈: random 모듈¶ random은 난수를 발생시키는 모듈로 randint, c..

Python/Pandas

판다스 pandas (8) - unique(), nunique()

데이터 분석하다가 유일값 찾고 싶을 때 예제데이터는 데이콘 대회 중 이미 끝난 '제주도 도로 교통량 예측 AI 경진대회'에서 가져왔다. https://dacon.io/competitions/official/235985/data 제주도 도로 교통량 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io train = pd.read_csv('./jeju_traffic/train.csv') test = pd.read_csv('./jeju_traffic/test.csv') train 1. unique( ) - 데이터에 고유값들이 어떠한 종류들이 있는지 알고 싶을때 사용하는 함수 도로의 차량 평균 속도와 상관있을 것 같은 피처들 살펴보기 pr..

Python/Pandas

판다스 pandas (7) - lambda, apply, map

apply lambda 식으로 데이터 가공¶ 칼럼에 일괄적으로 데이터 가공을 하는 것이 속도 면에서 빠르고 복잡한 데이터 가공이 필요할 경우 이용 In [2]: def get_square(a): return a**2 print('3의 제곱은:', get_square(3)) 3의 제곱은: 9 lambda는 이런 함수 선언과 함수 내의 처리를 한 줄의 식으로 쉽게 변환하는 식임 : 로 입력 인자와 반환될 입력 인자의 계산식(반환값)을 분리함 여러 개의 값을 입력 인자로 사용해야 할 때, map( )함수과 같이 씀 In [3]: lambda_square = lambda x : x ** 2 print('3의 제곱은:', lambda_square(3)) 3의 제곱은: 9 In [5]: a = [1, 2, 3] s..

Python/Pandas

판다스 pandas (6) - isna( ), fillna( )

결손 데이터 처리하기¶ 머신러닝은 NaN 값을 처리하지 않으므로 다른 값으로 대체해야 함 결손 여부 확인: isna( ) 다른 값으로 대체: fillna( ) In [1]: import pandas as pd titanic_df = pd.read_csv('./titanic_train.csv') titanic_df Out[1]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female ..

얆생
'Python' 카테고리의 글 목록