반응형
빅데이터가 등장하기 이전엔 정형 데이터를 주로 이용했습니다.
(연관 규칙 학습, 유형분석, 유전자 알고리즘, 기계학습, 회귀분석) 하지만 최근 SNS가 발달함에 따라 비 정형화된 데이터를 많이 이용하고 있습니다.
테크닉 | 내용 | 예시 |
연관규칙학습 | 변인들 간에 주목할 만한 상관관계가 있는지 찾아내는 방법 | 커피를 구매하는 사람이 탄산음료를 더 많이 사는가? |
유형분석 | 문서를 분류하거나 조직을 그룹으로 나눌 때, 또는 온라인 수강생들을 특성에 따라 분류할 때 사용 |
이 사용자는 어떤 특성을 가진 집단에 속하는가? |
유전자 알고리즘 | 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 매커니즘을 통해 점진적으로 진화 시켜 나가는 방법 |
최대한 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가? |
기계학습 | 훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법 | 기존의 시청 기록을 바탕으로 시청자가 현재 보유한 영화 중에서 어떤 것을 가장 보고 싶어할까? |
회귀분석 | 독립변수를 조작함에 따라, 종속변수가 어떻게 변하는지를 보면서 두 변인의 관계를 파악할 때 사용 |
구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는가? |
감정분석 | 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석 | 새로운 환불 정책에 대해 고객의 평가는 어떠한가? |
소설네트워크분석 (=사회관계망분석) |
특정인과 다른 사람이 몇 촌 정도의 관계인가를 파악할 때 사용하고, 영향력있는 사람을 찾아낼 때 사용 | 고객들 간 관계망은 어떻게 구성되어 있나? |
반응형
'데이터분석' 카테고리의 다른 글
빅데이터 위기 요인에 따른 통제 방안 (0) | 2021.09.30 |
---|---|
빅데이터 시대의 위기 요인 (0) | 2021.09.29 |
빅데이터의 영향 (0) | 2021.09.27 |
빅데이터의 가치 (0) | 2021.09.26 |
빅데이터가 만들어내는 본질적인 변화 (0) | 2021.09.25 |