파이썬

Python/Numpy

넘파이 numpy (5) - concatenate(), 배열 합치기

concatenate 메소드, 배열 합치기 concatenate 메소드는 선택한 축 (axis)의 방향으로 배열을 연결해주는 메소드 1) 1차원 배열 In [2]: import numpy as np a1 = np.array([1, 2, 3]) b1 = np.array([4, 5, 6]) print(a1) print(b1) [1 2 3] [4 5 6] In [4]: #1차원 배열에 concanate 적용하기 np.concatenate((a1, b1), axis=0) Out[4]: array([1, 2, 3, 4, 5, 6]) 1차원에서 axis=0은 행방향이나 열방향이라는 개념이 없음 axis=1로 하면 에러 발생 >> 방향이 axis=0 하나 뿐이기 때문(직선이라고 생각) 2) 2차원 배열 In [5]:..

Data Science/Dacon

[회귀] 제주도 도로 교통량 예측 AI 경진대회

제주도 도로 교통량 예측 AI 경진대회 https://dacon.io/competitions/official/235985/data In [51]: import pandas as pd data_info = pd.read_csv('/content/data_info.csv') data_info Out[51]: 변수명 변수 설명 0 id 아이디 1 base_date 날짜 2 day_of_week 요일 3 base_hour 시간대 4 road_in_use 도로사용여부 5 lane_count 차로수 6 road_rating 도로등급 7 multi_linked 중용구간 여부 8 connect_code 연결로 코드 9 maximum_speed_limit 최고속도제한 10 weight_restricted 통과제한하중 1..

Python/Pandas

판다스 pandas (8) - unique(), nunique()

데이터 분석하다가 유일값 찾고 싶을 때 예제데이터는 데이콘 대회 중 이미 끝난 '제주도 도로 교통량 예측 AI 경진대회'에서 가져왔다. https://dacon.io/competitions/official/235985/data 제주도 도로 교통량 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io train = pd.read_csv('./jeju_traffic/train.csv') test = pd.read_csv('./jeju_traffic/test.csv') train 1. unique( ) - 데이터에 고유값들이 어떠한 종류들이 있는지 알고 싶을때 사용하는 함수 도로의 차량 평균 속도와 상관있을 것 같은 피처들 살펴보기 pr..

Data Science/파이썬 머신러닝 완벽 가이드

[sklearn] (7) - GridSearchCV

GridSearchCV - 교차 검증과 최적 하이퍼 파라미터 튜닝을 한 번에 ¶ 하이퍼 파라미터 값을 조정하여 알고리즘의 예측 성능을 개선할 수 있음 In [1]: grid_parameters = {'max_depth': [1, 2, 3], 'min_samples_split': [2, 3] } GridSearchCV 클래스의 input인자¶ estimator: classifier, regressor, pipeline 등 param_grid: key + 리스트값을 가지는 딕셔너리가 주어짐. estimator 튜닝을 위해 파라미터명과 사용될 여러 파라미터 값을 지정 scoring: 예측 성능을 측정할 평가 방법을 지정. 보통은 accuracy로 지정함 cv: 교차 검증을 위해 분할되는 학습/테스트 세트의 개..

Python/Pandas

판다스 pandas (7) - lambda, apply, map

apply lambda 식으로 데이터 가공¶ 칼럼에 일괄적으로 데이터 가공을 하는 것이 속도 면에서 빠르고 복잡한 데이터 가공이 필요할 경우 이용 In [2]: def get_square(a): return a**2 print('3의 제곱은:', get_square(3)) 3의 제곱은: 9 lambda는 이런 함수 선언과 함수 내의 처리를 한 줄의 식으로 쉽게 변환하는 식임 : 로 입력 인자와 반환될 입력 인자의 계산식(반환값)을 분리함 여러 개의 값을 입력 인자로 사용해야 할 때, map( )함수과 같이 씀 In [3]: lambda_square = lambda x : x ** 2 print('3의 제곱은:', lambda_square(3)) 3의 제곱은: 9 In [5]: a = [1, 2, 3] s..

Python/Pandas

판다스 pandas (5) - aggregation, groupby

정렬, Aggregation 함수, GroupBy 적용¶ sort_values( )¶ 주요 파라미터: by='칼럼명', ascending=True(기본 오름차순), inplace=False(호출한 df는 그대로 유지하면서 정렬된 df를 결과로 반환) In [1]: import pandas as pd titanic_df = pd.read_csv('./titanic_train.csv') titanic_df Out[1]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cuming..

얆생
'파이썬' 태그의 글 목록