Data Science/Crawling

Data Science/Crawling

전국 할리스 매장 데이터 가져오기(정적페이지 크롤링)

할리스 전국 매장의 지역 이름, 매장명, 전화번호 데이터 가져오기기 In [36]: page_no = 1 hollys_url = f"https://www.hollys.co.kr/store/korea/korStore2.do?pageNo={page_no}&sido=&gugun=&store=" hollys_url Out[36]: 'https://www.hollys.co.kr/store/korea/korStore2.do?pageNo=1&sido=&gugun=&store=' In [37]: import requests source = requests.get(hollys_url).text source Out[37]: '\r\n\r\n\r\n\r\n\t\r\n\r\n\t\r\n\t\t본문 바로가기\r\n\t\r\n\..

Data Science/Crawling

데이터 수집 개요/Overview of Data Collection

일반적인 데이터 특징 1. 존재론적 특징 - 정성적 데이터 : 데이터 자체가 하나의 텍스트를 이루고 있기 때문에 데이터 하나 하나가 함축된 정보를 가짐 ex) 환율이 내리고 있어 올해 목표한 수출 목표의 조기 달성이 가능해 보인다. - 정량적 데이터 : 여러 속성(성별, 이름, 나이, 주소 등)이 모여 하나의 객체를 형성하고, 각 속성은 속성 하나 혹은 여러 개의 속성이 결합해 측정이나 설명이 가능 구분 정성적 데이터 정량적 데이터 형태 비정형 데이터 정형, 반정형 데이터 특징 객체 하나에 함의된 정보를 가짐 속성이 모여 객체를 이룸 구성 언어, 문자 등으로 이루어짐 수치, 도형, 기호 등으로 이루어짐 저장 형태 파일, 웹 데이터베이스, 스프레드시트 소스 위치 외부 시스템(주로 소셜 데이터) 내부 시스템..

얆생
'Data Science/Crawling' 카테고리의 글 목록