본문 바로가기
데이터분석

빅데이터의 유형

by 쓱쓱기획 2021. 4. 3.
반응형



빅데이터의 유형에 대해서 알아보려고 합니다.
데이터 크기를 기준으로 유형을 나눠보는 것이 명확할 것 같아 크기 기준으로 표기해보았습니다.  

정형화 데이터는 텍스트 위주의 데이터를 말합니다. 그리고 반정형 및 비정형 데이터들이 대량으로 발생되고 있죠. 
데이터 크기 기준으로는 MB, GB가 정형화 데이터, TB는 반정형 데이터, PB는 빅데이터 크기라고 합니다. 


정형화 데이터 vs 비정형 데이터 

 

정형화 데이터
기반 시스템(기간계, ERP 등) 관리계, 정보계, 분석계 등 업무 시스템 데이터
데이터 크기 : MB, GB

- 재무정보, 급여표, 인사정보 
- 재고관리, 거래정보, 거래처 정보



반정형 데이터
정형 구조의 데이터 모델을 준수하지 않는 정형 데이터의 한 형태 
- 그 외 다양한 장치 데이터 
데이터 크기 : TB

- Web Log데이터 
- 보안 및 특정 센서 데이터 
- 마케팅 정보 

 

데이터 구분

 

빅데이터 
형태나 구조가 정형화되지 않은 데이터 형식 다양한 형식의 모든 데이터 
데이터 크기 : PB

- 문서, 텍스트, 이미지, 동영상, Social Data
- 센서(Sencor) 데이터 장치 Log 데이터 
- 가상 데이터 RFID 데이터 
- SNS 데이터 
- 그 외 다양한 형식의 데이터 포함 


빅데이터란 모든 데이터를 포괄하는 것이긴 히지만
데이터 크기와 종류가 다양해야 빅데이터라고 할 수 있습니다. 

 

 

반응형

'데이터분석' 카테고리의 다른 글

k-평균 군집분석  (0) 2021.05.22
데이터분석 준전문가 ADsP 도전  (0) 2021.05.09
빅데이터의 개요 및 특징  (0) 2021.03.27
데이터준전문가 (ADSP) 준비  (0) 2021.03.21
데이터분석적 사고  (0) 2020.11.15