Python

Python/Numpy

넘파이 numpy (2) - arange, reshape, indexing

ndarray를 편리하게 생성하기 - arange, zeros, ones arange는 range와 유사한 기능, array를 range로 표현하는 것 디폴트 인자는 stop값, 0부터 9까지 1차원 ndarray를 만듬, start값도 부여 가능 In [4]: import numpy as np sequence_array = np.arange(10) print(sequence_array) print(sequence_array.dtype, sequence_array.shape) [0 1 2 3 4 5 6 7 8 9] int32 (10,) zeros는 튜플로 shape값을 입력하면 모든 값을 0으로 채운 해당 shape을 반환 ones는 튜플로 입력하면 모두 1로 반환, dtype을 정해주지 않으면 디폴트는..

Python/Numpy

넘파이 numpy (1) - ndarray, dtype, astype

넘파이 ndarray 개요 ndarray를 이용해 넘파이에서 다차원 배열을 쉽게 생성, 다양한 연산 수행 In [1]: import numpy as np array1 = np.array([1, 2, 3]) print('array1 type: ', type(array1)) print('array1 array 형태:', array1.shape) array2 = np.array([[1, 2, 3], [2, 3, 4]]) print('array2 type:', type(array2)) print('array2 array 형태:', array2.shape) array3 = np.array([[1, 2, 3]]) print('array3 type: ', type(array3)) print('array3 array ..

Python/seaborn, matplotlib

matplotlib.pylot으로 그래프 그리기

matplotlib으로 간단한 그래프를 그려보자 matplotlib 불러오고 임의의 데이터 만들어주기 import matplotlib.pyplot as plt customers = ['abc', 'def', 'ghi', 'jkl', 'mno'] customers_index = range(len(customers)) sale_amounts = [127, 90, 201, 111, 232] barplot 그리기 fig = plt.figure() ax1 = fig.add_subplot(1,1,1) #하위 그래프의 행과 열 지정, (1,1,1)은 ax1이 유일한 하위그래프임을 의미 ax1.bar(customers_index, sale_amounts, align='center', color='dark blue') ..

Python/seaborn, matplotlib

plotly로 interactive chart 만들기

plotly란? - interative한 표현을 제공하는 파이썬 그래픽 라이브러리(마우스를 통해 직접 그래프를 살펴볼 수 있음) - javascript로 구현된 plotly.js를 기반으로 파이썬에서 생성한 데이터 시각화 객체를 javascript로 생성해주는 패키지 - 최종적으로 html 코드로 구현되고, 웹 브라우저 상에서 표시됌 https://plotly.com/python/ Plotly Plotly's plotly.com plotly.express - px로 축약되어 표현 - graph_objects를 API형식으로 사용자에게 제공 - 데이터만 가공해서 API에 입력하면 시각화가 가능, 사용법이 쉽다 python-api-reference/plotly.express.html plotly.expres..

Python/seaborn, matplotlib

seaborn으로 기본 그래프 그리기

대표적인 plot들을 소개하겠음.. 경향성 표현하는 그래프 라이브러리와 데이터 불러오고, 시각화 위한 세팅하기 import seaborn as sns sns.set_theme(style='whitegrid') penguins = sns.load_dataset("penguins").dropna() penguins lineplot - 특정 데이터를 x, y로 표시하여 관계를 확인할 수 있는 선 그래프 - 수치형 지표들 간의 경향을 파악할 때 많이 사용한다 sns.lineplot(data=penguins, x = 'body_mass_g', y = 'bill_length_mm', ci = None, #ci = confidential interval 신뢰구간, 오차범위 표시해줌 hue = "species", #h..

Python/seaborn, matplotlib

데이터 시각화/Data Visualization

Matplotlib 각종 논문에서 figure 그릴 때 많이 사용 figure라는 도화지에 여러 가지 component를 얹어서 그래프를 완성하는 컨셉 크게 pyplot을 이용하여 빠르고 적당한 퀄리티의 그래프를 그리는 방법과 OOP-style을 이용하여 디테일하게 표현하는 방법이 있음 Seaborn matplotlib를 기본으로 다양한 시각화 기법을 제공하는 라이브러리 numpy, pandas 같은 ‘파이썬 라이브러리’들을 편하게 시각화하는 것을 중점으로 둠 pandas DataFrame과 호환이 매우 잘 됨(DataFrame을 직접 지원) 다양한 기본 plot들이 있어 빠르게 통계 분석하기에 편함 >> EDA 기본 세팅: sns.xxxplot(data=df) Lineplot boxplot Jointp..

얆생
'Python' 카테고리의 글 목록 (3 Page)