반응형
빅데이터의 유형에 대해서 알아보려고 합니다.
데이터 크기를 기준으로 유형을 나눠보는 것이 명확할 것 같아 크기 기준으로 표기해보았습니다.
정형화 데이터는 텍스트 위주의 데이터를 말합니다. 그리고 반정형 및 비정형 데이터들이 대량으로 발생되고 있죠.
데이터 크기 기준으로는 MB, GB가 정형화 데이터, TB는 반정형 데이터, PB는 빅데이터 크기라고 합니다.
정형화 데이터
기반 시스템(기간계, ERP 등) 관리계, 정보계, 분석계 등 업무 시스템 데이터
* 데이터 크기 : MB, GB
- 재무정보, 급여표, 인사정보
- 재고관리, 거래정보, 거래처 정보
반정형 데이터
정형 구조의 데이터 모델을 준수하지 않는 정형 데이터의 한 형태
- 그 외 다양한 장치 데이터
* 데이터 크기 : TB
- Web Log데이터
- 보안 및 특정 센서 데이터
- 마케팅 정보
빅데이터
형태나 구조가 정형화되지 않은 데이터 형식 다양한 형식의 모든 데이터
* 데이터 크기 : PB
- 문서, 텍스트, 이미지, 동영상, Social Data
- 센서(Sencor) 데이터 장치 Log 데이터
- 가상 데이터 RFID 데이터
- SNS 데이터
- 그 외 다양한 형식의 데이터 포함
빅데이터란 모든 데이터를 포괄하는 것이긴 히지만
데이터 크기와 종류가 다양해야 빅데이터라고 할 수 있습니다.
반응형
'데이터분석' 카테고리의 다른 글
k-평균 군집분석 (0) | 2021.05.22 |
---|---|
데이터분석 준전문가 ADsP 도전 (0) | 2021.05.09 |
빅데이터의 개요 및 특징 (0) | 2021.03.27 |
데이터준전문가 (ADSP) 준비 (0) | 2021.03.21 |
데이터분석적 사고 (0) | 2020.11.15 |