python

Data Science/Dacon

[분류] 데이콘 범죄 유형 분류 대회 (1) - EDA

데이콘 Basic 범죄 유형 분류 AI 경진대회 배경: 범죄 관련 데이터를 분석하여 어떤 유형의 범죄가 발생할지 예측하고, 예측 결과를 바탕으로 범죄에 대한 대응을 빠르게 할 수 있도록 하기 위함 주제: 범죄 유형을 분류하는 AI 알고리즘 개발 사건 발생 장소 및 기후 데이터 분석을 통해 세 가지 범죄 유형을 분류하는 AI 모델을 개발 https://dacon.io/competitions/official/236109/overview/description 일부 데이터 설명 -- ID : 샘플 별 고유 id -- 월 : 사건 발생월 -- 요일 : 월요일 ~ 일요일 -- 시간 : 사건 발생 시각 -- 소관경찰서 : 사건 발생 구역의 담당 경찰서 -- 소관지역 : 사건 발생 구역 -- 사건발생거리 : 가장 가까..

Data Science/파이썬 머신러닝 완벽 가이드

[sklearn] (16) 분류 모델 개요, 결정 트리 특징(Classification, Decision Tree)

분류 classification의 개요 지도학습은 명시적인 정답(레이블)이 있는 데이터가 주어진 상태에서 학습하는 머신러닝 방식 대표적인 유형인 '분류'는 학습데이터로 주어진 데이터의 피처와 레이블값을 머신러닝 알고리즘으로 학습해 모델을 생성하고, 새로운 모델에 새로운 데이터값이 주어졌을 때 미지의 레이블 값을 예측하는 것 ex) 베이즈 통계와 생성 모델에 기반한 나이브 베이즈, 독립변수와 종속변수의 선형관계성에 기반한 로지스틱 회귀, 개별 클래스 간의 최대 분류 마진을 효과적으로 찾아주는 서포트 벡터 머신 등.. 2. 앙상블은 분류에서 가장 각광받는 방법 중 하나임. 정형데이터의 예측 분석에서는 앙상블이 매우 높은 예측 성능을 보임 일반적으로 배깅(bagging)과 부스팅(boosting)으로 나뉨 전..

Data Science/파이썬 머신러닝 완벽 가이드

[sklearn] (15) - 피마 인디언 당뇨병 예측, 평가(Pima Indian Diabetes Prediction)

피마 인디언 당뇨병 예측 Pima Indian Diabetes 데이터셋을 이용해 당뇨병 여부를 판단하는 머신러닝 예측 모델 만들고 평가 지표 적용하기 데이터셋은 캐글에서 다운로드: https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database Pregnancies: 임신 횟수 Glucose: 포도당 부하 검사 수치 BloodPressure: 혈압 SkinThickness: 팔 삼두근 뒤쪽 피하지방 측정값 Insulin: 혈청 인슐린 BMI: 체질량지수 DiabetesPedigreeFunction: 당뇨 내력 가중치값 Age: 나이 Outcome: 클래스 결정값(0 또는 1) Pima Indians Diabetes Database Predict ..

Python/Numpy

넘파이 numpy (5) - concatenate(), 배열 합치기

concatenate 메소드, 배열 합치기 concatenate 메소드는 선택한 축 (axis)의 방향으로 배열을 연결해주는 메소드 1) 1차원 배열 In [2]: import numpy as np a1 = np.array([1, 2, 3]) b1 = np.array([4, 5, 6]) print(a1) print(b1) [1 2 3] [4 5 6] In [4]: #1차원 배열에 concanate 적용하기 np.concatenate((a1, b1), axis=0) Out[4]: array([1, 2, 3, 4, 5, 6]) 1차원에서 axis=0은 행방향이나 열방향이라는 개념이 없음 axis=1로 하면 에러 발생 >> 방향이 axis=0 하나 뿐이기 때문(직선이라고 생각) 2) 2차원 배열 In [5]:..

Python/Numpy

넘파이 numpy (4) - random 모듈(rand, randint, randn, choice, seed, etc)

참고: https://codetorial.net/numpy/random.html NumPy 난수 생성 (Random 모듈) - Codetorial 예제1 - 기본 사용 import numpy as np a = np.random.randn(5) print(a) b = np.random.randn(2, 3) print(b) sigma, mu = 1.5, 2.0 c = sigma * np.random.randn(5) + mu print(c) [ 0.06704336 -0.48813686 0.4275107 -0.9015714 -1.30597604] [[ 0.87354043 0.03783 codetorial.net numpy의 서브모듈: random 모듈¶ random은 난수를 발생시키는 모듈로 randint, c..

Data Science/Dacon

[회귀] 제주도 도로 교통량 예측 AI 경진대회

제주도 도로 교통량 예측 AI 경진대회 https://dacon.io/competitions/official/235985/data In [51]: import pandas as pd data_info = pd.read_csv('/content/data_info.csv') data_info Out[51]: 변수명 변수 설명 0 id 아이디 1 base_date 날짜 2 day_of_week 요일 3 base_hour 시간대 4 road_in_use 도로사용여부 5 lane_count 차로수 6 road_rating 도로등급 7 multi_linked 중용구간 여부 8 connect_code 연결로 코드 9 maximum_speed_limit 최고속도제한 10 weight_restricted 통과제한하중 1..

얆생
'python' 태그의 글 목록