본문 바로가기

데이터시각화2

[머신러닝/딥러닝] 경진대회_자전거 대여 수요 예측 (1) 2부 6장 실습하고 해당 내용을 정리한 내용입니다. 1. 경진대회 이해 https://www.kaggle.com/competitions/bike-sharing-demand Bike Sharing Demand | Kaggle www.kaggle.com 2부 6장에서 사용되는 경진대회는 자전거 대여 수요 예측 경진대회 입니다. 2014년 5월에서 2015년 5월까지 약 1년 동안 개최되었던 대회이며, 총 3,242팀이 참가했습니다. 대회의 주된 내용은 워싱턴 D.C의 자전거 무인 대여 시스템 과거 기록을 기반으로 향후 자전거 대여 수요를 예측하는 대회입니다. 또한 본 대회는 플레이그라운드 대회로 난이도가 낮은 연습용 대회입니다. 따라 처음 입문자가 프로세스를 익히고 실력을 키우기에 적합한 대회로 볼 수 있습.. 2022. 9. 25.
[머신러닝/딥러닝] 데이터를 한눈에 주요 시각화 그래프 1부 4장을 정리한 내용입니다. 1. 데이터 종류 정형 데이터는 크게 수치형 데이터와 범주형 데이터로 나뉩니다. 대분류 소분류 예시 수치형 데이터 (사칙 연산이 가능한 데이터) 연속형 데이터 키, 몸무게, 수입 이산형 데이터 과일 개수, 책의 페이지 수 범주형 데이터 (범주로 나누어지는 데이터) 순서형 데이터 학점, 순위(랭킹) 명목형 데이터 성별, 음식 종류, 우편 번호 - 수치형 데이터 수치형 데이터는 사칙 연산이 가능한 데이터를 입니다. 이는 다시 연속형 데이터와 이산형 데이터로 나뉩니다. 연속형 데이터 : 값이 연속된 데이터 입니다. 예시로는 '키'와 같이 170cm와 171cm 사이에 170.1cm, 170.2cm, 170.9999cm 등 무한히 많은 값이 있습니다. 이렇게 값이 끊기지 않고 연.. 2022. 9. 12.