Sunday, April 1, 2012

EDA 1. 탐색적자료분석이란?

학습 목표
  1. 탐색적 자료 분석을 정의할 수 있다. 
  2. 탐색적 자료 분석의 네 가지 주제를 이해할 수 있다.
  3. 자료분석의 기본철학을 이해한다. 
  4. 그래프의 유용성을 이해할 수 있다. 
자료 분석
  • EDA(탐색적 자료 분석) : 데이터의 특징과 내재하는 구조적인 관계를 알아내기 위한 분석 기법으로 이러한 자료의 탐색 과정을 통하여 얻은 정보를 기초로 통계모형을 세울 수 있음, 미지의 특성을 파악하고 자료구조를 파악할 수 잇는 증거 수집의 과정
  • CDA (확증적 자료 분석) : 관측된 자료의 형태로 효과의 재현성을 평가하고 추정하는 전통적인 분석 과정, 신뢰구간의 추정이나 유의성 검정 등이 여기에 해당됨, 수집된 정보와 증거에 대한 차분한 실증적 평가에 중점을 둬서 결론은 유도한다.
탐색적 자료 분석(exploratory data analysis)
  • 자료를 이론적인 모델이나 틀에 적용하기 보다는 데이터를 잇는 그대로 보여주는데 중점을 맞춰서 데이터 스스로 말하도록 유도하는 분석법

EDA의 4가지 주제
1.저항성
2.잔차의 해석 : 잔차를 구해봄으로써 데이터의 또다른 측면의 특징을 볼수 있다.
3. 자료의 재표현 : 분포의 대칭성, 선형성, 분산의 안정성, 관련변수의 가법성(더하기로 표현 가능하게끔 하는것. 로그를 취하는 등의 작업)이 나타나도록 자료를 재표현하는 것
4.자료의 현시성 : 자료를 그래프로 표현하는 것.

자료분석의 기본철학

  1. 모형-자료의 싸이클 : 모형 가정, 자료를 가지고 confirm
  2. 자료-분석의 싸이클 : 양질의 자료 수집 후 어떤 분석을 해야 하는가를 판단

No comments:

Post a Comment