데이콘 Basic 자동차 가격 예측 AI 경진대회 https://dacon.io/competitions/official/236114/overview/description 자동차 가격을 예측하는 AI 알고리즘 개발 자동차 생산년도, 브랜드, 종류 등 자동차와 관련된 데이터를 활용하여 자동차 가격을 예측하는 AI 모델을 개발 라이브러리 정의 In [1]: import pandas as pd import random random.seed(30) import os import numpy as np import seaborn as sns import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') In [31]: #한글 폰트 사..
데이콘 Basic 범죄 유형 분류 AI 경진대회 배경: 범죄 관련 데이터를 분석하여 어떤 유형의 범죄가 발생할지 예측하고, 예측 결과를 바탕으로 범죄에 대한 대응을 빠르게 할 수 있도록 하기 위함 주제: 범죄 유형을 분류하는 AI 알고리즘 개발 사건 발생 장소 및 기후 데이터 분석을 통해 세 가지 범죄 유형을 분류하는 AI 모델을 개발 https://dacon.io/competitions/official/236109/overview/description 일부 데이터 설명 -- ID : 샘플 별 고유 id -- 월 : 사건 발생월 -- 요일 : 월요일 ~ 일요일 -- 시간 : 사건 발생 시각 -- 소관경찰서 : 사건 발생 구역의 담당 경찰서 -- 소관지역 : 사건 발생 구역 -- 사건발생거리 : 가장 가까..
타이타닉 생존자 예측¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('./titanic_train.csv') titanic_df.head(3) Out[1]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cumings, Mrs. John Bradley (Flore..
데이터 분석하다가 유일값 찾고 싶을 때 예제데이터는 데이콘 대회 중 이미 끝난 '제주도 도로 교통량 예측 AI 경진대회'에서 가져왔다. https://dacon.io/competitions/official/235985/data 제주도 도로 교통량 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io train = pd.read_csv('./jeju_traffic/train.csv') test = pd.read_csv('./jeju_traffic/test.csv') train 1. unique( ) - 데이터에 고유값들이 어떠한 종류들이 있는지 알고 싶을때 사용하는 함수 도로의 차량 평균 속도와 상관있을 것 같은 피처들 살펴보기 pr..
데이터 전처리 Data Preprocessing 문자열 값을 입력값으로 허용하지 않음, 모든 문자열 값은 인코딩돼서 숫자형으로 변환해야 함 데이터 인코딩 레이블 인코딩 Label Encoding 카테고리 feature를 코드형 숫자값으로 변환하는 것 LabelEncoder 클래스로 구현 In [2]: from sklearn.preprocessing import LabelEncoder items = ['TV', '냉장고', '전자레인지', '컴퓨터', '선풍기', '선풍기', '믹서', '믹서'] #LabelEncoder를 객체로 생성 후 fit과 transform으로 레이블 인코딩 수행 encoder = LabelEncoder() encoder.fit(items) labels = encoder.trans..
붓꽃 품종 예측하기 ¶ sklearn.datasets 모듈: 사이킷런에서 자체 제공하는 데이터 셋 생성¶ sklearn.tree 모듈: 트리 기반 ML알고리즘(의사 결정 트리)을 구현한 클래스 모임 sklearn.model_selection 모듈: 학습데이터와 검증데이터, 예측데이터로 데이터를 분리하거나, 최적의 하이퍼 파라미터로 평가하기 위한 다양한 모듈의 모임 ¶ 1. 라이브러리 정의¶ In [2]: import sklearn from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split 2. 데이터 불러오기¶ In..