Step 1. 질문하기 (Ask Question)
데이터가 주어진 상태에서 질문을 할 수도, 질문에 답할 수 있는 데이터를 수집할 수도 있다.
Step 2. 데이터 랭글링 (Wrangle Data)
- 데이터 랭글링 : 원자료(row data)를 보다 쉽게 접근하고 분석할 수 있도록 데이터를 정리하고 통합하는 과정
- 세부적으로는 데이터의 수집(gather), 평가(assess), 정제(clean), 작업으로 나눌 수 있다
Step 3. 데이터 탐색 (EXploratory Data Analysis)
데이터의 패턴을 찾고, 관계를 시각화하는 작업 등을 통해 데이터에 대한 직관을 극대화
Step 4. 결론 도출 또는 예측 (Draw conclusions or Make predictions)
- 기술 통계 결과를 바탕으로 질문에 대한 답과 결론을 도출할 수 있다.
- 머신러닝 또는 통계 추정 과정을 거치게 되면 예측을 만들어 낼 수도 있다.
Step 5. 결과 공유 (Communicate the results)
보고서, 이메일, 블로그 등 다양한 방법을 통해 발견한 통찰들을 공유할 수 있다.