visualization

Tableau

태블로 소개, 태블로 퍼블릭, 학생용 태블로 설치 방법

Tableau 태블로란? https://www.tableau.com/ko-kr/why-tableau/what-is-tableau Tableau란? Tableau란? Tableau는 데이터를 사용해 문제를 해결하는 방식에 혁신을 가져온 시각적 분석 플랫폼으로, 사람과 조직이 데이터를 최대한 활용하도록 지원합니다. www.tableau.com Tableau는 데이터를 사용해 데이터 분석 및 시각화를 하는 BI(Business Intelligence) 솔루션이다. 데이터를 활용해 의사결정을 내린 후 결과적으로 비지니스 목표를 달성하게 하는 과정과 방법이다. 태블로 퍼블릭 버전 설치 방법 다운로드 링크: https://www.tableau.com/products/public/download 설치 가이드: htt..

Data Science/Dacon

[회귀] 자동차 가격 예측 AI 경진대회 (1) - 데이터 불러오기, 간단 EDA

데이콘 Basic 자동차 가격 예측 AI 경진대회 https://dacon.io/competitions/official/236114/overview/description 자동차 가격을 예측하는 AI 알고리즘 개발 자동차 생산년도, 브랜드, 종류 등 자동차와 관련된 데이터를 활용하여 자동차 가격을 예측하는 AI 모델을 개발 라이브러리 정의 In [1]: import pandas as pd import random random.seed(30) import os import numpy as np import seaborn as sns import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') In [31]: #한글 폰트 사..

Data Science/Dacon

[분류] 데이콘 범죄 유형 분류 대회 (1) - EDA

데이콘 Basic 범죄 유형 분류 AI 경진대회 배경: 범죄 관련 데이터를 분석하여 어떤 유형의 범죄가 발생할지 예측하고, 예측 결과를 바탕으로 범죄에 대한 대응을 빠르게 할 수 있도록 하기 위함 주제: 범죄 유형을 분류하는 AI 알고리즘 개발 사건 발생 장소 및 기후 데이터 분석을 통해 세 가지 범죄 유형을 분류하는 AI 모델을 개발 https://dacon.io/competitions/official/236109/overview/description 일부 데이터 설명 -- ID : 샘플 별 고유 id -- 월 : 사건 발생월 -- 요일 : 월요일 ~ 일요일 -- 시간 : 사건 발생 시각 -- 소관경찰서 : 사건 발생 구역의 담당 경찰서 -- 소관지역 : 사건 발생 구역 -- 사건발생거리 : 가장 가까..

Data Science/파이썬 머신러닝 완벽 가이드

[sklearn] (17) 결정 트리 모델의 시각화- Graphviz, export_graphviz()

결정 트리 모델의 시각화 Graphviz 패키지: 그래프 기반의 dot파일로 기술된 다양한 이미지를 쉽게 시각화할 수 있는 패키지(파이썬으로 개발 X >> 윈도우에 설치 후 파이썬 Wrapper 모듈 별도 설치 필요) 사이킷런은 Graphviz 패키지와 쉽게 인터페이스할 수 있도록 export_graphviz() 제공 학습이 완료된 Estimator, 피처 이름 리스트, 레이블 이름 리스트를 입력하면 결정 트리 규칙을 시각화해줌 https://graphviz.org/download iris 데이터셋을 결정트리를 이용해 학습한 뒤 어떻게 규칙이 만들어지는지 확인해보자 In [2]: from sklearn.tree import DecisionTreeClassifier from sklearn.datasets ..

Python/seaborn, matplotlib

matplotlib, seaborn에서 한글 폰트 사용하기

예제 데이터는 데이콘 대회 중 '감귤 착과량 예측 AI경진대회'의 train 데이터셋 이용 In [1]: import pandas as pd gyul_train_df = pd.read_csv('./jeju_mandarin/train.csv') In [2]: gyul_growth = gyul_train_df[['착과량(int)', '수고(m)', '수관폭1(min)', '수관폭2(max)', '수관폭평균']] gyul_growth Out[2]: 착과량(int) 수고(m) 수관폭1(min) 수관폭2(max) 수관폭평균 0 692 275.0 287.0 292.0 289.5 1 534 293.0 284.0 336.0 310.0 2 634 300.0 392.0 450.0 421.0 3 639 289.0 368.0..

얆생
'visualization' 태그의 글 목록