데이터시각화

Tableau

바 차트, 라인 차트, 영역 차트 그리기 - Bar chart/Line chart/Area chart

눈에 잘 보이는 바 차트 만들기 - 지역에 따른 sales 살피기 - 샘플 데이터 Sample - Superstore 이용 1. 불필요한 필드 레이블 숨기기 2. 축 머리글 표시 해제 후 레이블 직접 붙이기 → 다시 표시하고 싶으면 필드에 대고 마우스 오른쪽 > '머리글 표시' 선택 → 축에 대고 마우스 오른쪽 버튼 > '머리글 표시' 해제 3. 불필요한 참조선 없애기 → 그래프 배경에 대고 마우스 오른쪽 > 서식 > 라인 서식 > 각 시트, 행, 열마다 격자선과 축 눈금자, 축 눈금선 조절 4. 0이 되는 기준선 표시하기 → 0 기준선이 없으면 막대 그래프가 공중에 떠있는 것처럼 보임 5. 불투명도 조절을 통해 색상 톤 다운(보는 사람으로 하여금 눈의 피로도 ↓) → 마크 > '색상'에서 색상 및 불투..

Tableau

태블로 시작하기 - 데이터 준비, 연결, 작업하기

데이터 가져오기 파일에 연결 엑셀 파일(xlsx), 텍스트 파일(txt, csv), JSON 파일, pdf 파일, 공간 파일(shape), 통계 파일(R, SPSS, SAS) 서버에 연결 Dropbox, Google Analytics, Google Drive, MariaDB, MySQL, Salesforce, Spark SQL 등 굉장히 많은 서버와 연결하여 사용 가능 데이터 준비하기 라이브, 추출은 데스크탑 버전에서만 지원 데이터 원본 필터: 예를 들어, 가장 최신의 값만 쓰고 싶을 때 굳이 과거 데이터를 가져와 과부하를 만들 필요가 없는 상황에서 필터를 쓴다. → 범위, 최소, 최대 지정 가능 → 특수에서는 null값, null값이 아닌 값, 모든 값 지정 가능 → 화면의 퍼포먼스를 컨트롤할 때 좋은..

Tableau

태블로 소개, 태블로 퍼블릭, 학생용 태블로 설치 방법

Tableau 태블로란? https://www.tableau.com/ko-kr/why-tableau/what-is-tableau Tableau란? Tableau란? Tableau는 데이터를 사용해 문제를 해결하는 방식에 혁신을 가져온 시각적 분석 플랫폼으로, 사람과 조직이 데이터를 최대한 활용하도록 지원합니다. www.tableau.com Tableau는 데이터를 사용해 데이터 분석 및 시각화를 하는 BI(Business Intelligence) 솔루션이다. 데이터를 활용해 의사결정을 내린 후 결과적으로 비지니스 목표를 달성하게 하는 과정과 방법이다. 태블로 퍼블릭 버전 설치 방법 다운로드 링크: https://www.tableau.com/products/public/download 설치 가이드: htt..

Data Science/Dacon

[회귀] 자동차 가격 예측 AI 경진대회 (1) - 데이터 불러오기, 간단 EDA

데이콘 Basic 자동차 가격 예측 AI 경진대회 https://dacon.io/competitions/official/236114/overview/description 자동차 가격을 예측하는 AI 알고리즘 개발 자동차 생산년도, 브랜드, 종류 등 자동차와 관련된 데이터를 활용하여 자동차 가격을 예측하는 AI 모델을 개발 라이브러리 정의 In [1]: import pandas as pd import random random.seed(30) import os import numpy as np import seaborn as sns import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') In [31]: #한글 폰트 사..

Python/seaborn, matplotlib

matplotlib, seaborn에서 한글 폰트 사용하기

예제 데이터는 데이콘 대회 중 '감귤 착과량 예측 AI경진대회'의 train 데이터셋 이용 In [1]: import pandas as pd gyul_train_df = pd.read_csv('./jeju_mandarin/train.csv') In [2]: gyul_growth = gyul_train_df[['착과량(int)', '수고(m)', '수관폭1(min)', '수관폭2(max)', '수관폭평균']] gyul_growth Out[2]: 착과량(int) 수고(m) 수관폭1(min) 수관폭2(max) 수관폭평균 0 692 275.0 287.0 292.0 289.5 1 534 293.0 284.0 336.0 310.0 2 634 300.0 392.0 450.0 421.0 3 639 289.0 368.0..

얆생
'데이터시각화' 태그의 글 목록