Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 대전 팔레드오페라 후기
- 팔레드오페라 웨딩홀 후기
- 코린이블로그17일차 #알고리즘공부 #C언어
- 코린이블로그8일차 #알고리즘공부 #C언어
- 오블완
- 웅장한 웨딩홀
- CLI
- 팔레드오페라 웨딩홀 계약 후기
- 폰노이만의 구조
- 폰노이만 아키텍쳐
- 2주차
- 대전 웨딩홀 추천
- 대전 웨딩홀 비교
- 코드스테이츠
- 대전 피로연장 넉넉한 웨딩홀
- 코린이블로그4일차 #알고리즘공부 #C언어
- 대전 웨딩홀 가격
- 파이썬
- 코린이블로그9일차 #알고리즘공부 #C언어
- Linux Timezone
- EC2 MySQL
- 코린이블로그2일차 #알고리즘공부 #C언어
- codestates
- Von Neumann Architecture
- Django EC2 gunicorn nginx
- AI부트캠프
- Django EC2
- 티스토리챌린지
- 1주차
- AIBootcamp
Archives
- Today
- Total
찰리의 놀이터
[EDA] 탐색적 데이터 분석 본문
EDA(Exploratory Data Analysis, 탐색적 데이터 분석)
1. 정의
데이터를 관찰하고 이해하는 과정을 뜻합니다. 어떤 특성을 가지고 있는지, 결측치가 있는지, 있다면 얼마나 많은지, 데이터의 분포는 어떠한지, 내가 알려고 하는 것은 무엇인지 등. "이 데이터는 어떤 모양을 가졌을까?"라는 물음을 채워주는 과정입니다.
2. EDA의 목적
- 첫 번째 목적은 데이터를 이해하는 것입니다. 우리의 목적은 결국 의사 결정입니다. 의사 결정을 위해 다양한 각도에서 분석하여 표현해내는 것이 우리의 역할입니다.
- 두 번째 목적은 데이터에 대한 접근성입니다. 주어진 데이터를 분석하기 위해서는 많은 질문을 던져야 합니다. 한정된 시간에서는 질문의 양이 많아질수록 데이터에 대한 이해가 완성될 것입니다.
3. 과정
- 데이터 분석의 목적과 특성 확인. 특성에 대한 설명이 있다면 참고하여 데이터를 수집한 "이유" 를 파악
- 전체 데이터 확인, 앞쪽과 뒤쪽, 결측치와 이상치를 확인하고 필요하다면 데이터를 추가 혹은 제거
- 특성 중 목표하는 특성과 연관성이 있는 특성을 위주로 데이터를 변환 등 전처리 진행
사실 과정에서 '이상치 확인'을 마지막으로 EDA의 의미와 통한다고 생각하지만, 전처리의 바로 전까지의 과정을 EDA라고 하기도 하므로 전처리 진행까지의 과정을 서술하였습니다.
저는 현재 코드스테이츠 AI 부트캠프 6기 교육 진행 중이며 올바르지 않은 서술이 있을 경우 지적해주시면 감사하겠습니다.
'코드스테이츠 AI 부트캠프' 카테고리의 다른 글
Section 2 Project 회고 (0) | 2021.09.13 |
---|---|
[EP.0] 코드스테이츠 AI 부트캠프 신청 (0) | 2021.07.06 |