오늘은 데이터 준전문가 3장 데이터 분석의
개요에 대해 정리해보려 한다.
핵심 키워드로는 시각화, 탐색적 자료 분석,
공간분석, 시뮬레이션, 데이터 마이닝,
최적화에 대한 데이터 분석 개요가 있다.
시각화는 가장 낮은 수준의 분석으로 복잡한
분석보다도 더 효율적이다.
대용량 데이터를 다루는 빅데이터 분석에서
시각화는 필수이다.
탐색적 자료 분석은 다양한 차원과 값을
조합해가며 특이한 점이나
의미 있는 사실을 도출하고 분석의 최종 목적을
달성해과는 과정으로
데이터의 특징과 내재하는 구조적 관계를
알아내기 위한 기법의 통칭이다.
탐색적 자료 분석의 4가지 주제로는
저항성의 강조, 잔차 계산, 자료 변수의 재표현,
그래프를 통한 현시성이 있다.
공간분석은 공간적 차원과 관련된
속성들을 시각화하는 분석이다.
시뮬레이션은 고급 분석 기법으로 복잡한
실제 상황을 단순화 해서 컴퓨터상의 모델로
재현 또는 변경하는 기법을 말한다.
시뮬레이션은 Throunghput(처리량), Average Waiting Time(평균 대기 시간),
Average Queue Length(평균 대기열 길이),
Time in System(시스템 시간) 등의
지표가 활용된다.
데이터 마이닝은 고급 데이터 분석법으로
대용량 자료로 부터 정보를 요약하고 미래에
대한 예측을 목표로
유용한 지식을 추출하는 분석 방법이다.
데이터 마이닝에는 정확도, 정밀도, 디렉트 레이트,
리프트 등의 값으로 판단한다.
최적화는 목적 함수 값을 최소화하거나 최대화하는
것을 목표로 하는 방법이다.
'데이터분석' 카테고리의 다른 글
데이터베이스 정의와 특징 (0) | 2021.09.20 |
---|---|
데이터의 이해 (0) | 2021.09.19 |
k-평균 군집분석 (0) | 2021.05.22 |
데이터분석 준전문가 ADsP 도전 (0) | 2021.05.09 |
빅데이터의 유형 (0) | 2021.04.03 |