본문 바로가기
반응형

인과관계3

데이터의 이해 플랫폼 - 비즈니스 측면에서는 일반적으로 ‘공용 활용이 목적으로 구축된 유무형의 구조물’을 의미 - 빅데이터가 최근에는 다양한 서드파티 비즈니스에 활용되면서 역할을 할 것으로 전망 - 단순한 분석 응용프로그램뿐만 아니라 분석 서비스도 응용프로그램이 실행될 수 있는 기초를 이루는 컴퓨터 시스템 - IOT 시대가 되면 수많은 물건에 센서가 부착되어 끊임없이 생산된다. 이때 빅데이터 사업자들은 Iot를 통해 생산된 데이터를 저장해 두고 이 데이터를 API를 통해 공개하여 활용하도록 할 수 있음 OLTP, OLP - OLTP은 온라인 거래 처리로 다양한 과정의 연산이 하나의 단위 프로세스로 실행되도록 하는 단순 자동화에 치우쳐 있는 시스템 - OLP는 온라인 분석 처리로 다차원의 데이터를 대화식으로 정보를 분석.. 2021. 11. 16.
기초 통계분석 1. 기술 통계 - 기술통계 : 자료의 특성을 표, 그림, 통계량 등을 사용해 쉽게 파악할 수 있도록 정리/요약하는 것 1) 통계량에 의한 자료 정리 - 중심 위치의 측도 : 평균, 중앙값, 최빈값 - 산포의 측도 : 분산, 표준편차, 범위, 사분위 범위, 변동 계수, 표준오차 - 분포의 형태 : 왜도, 첨도 https://youtu.be/-AyjMFFkdzA 2) 그래프를 통한 자료 정리 - 범주형 자료 : 막대그래프, 파이차트, 모자이크 플릿 등 - 연속형 자료 : 히스토그램, 줄기-잎 그림, 상자 그림 등 2. 인과관계의 이해 1) 용어 - 종속변수(반응변수, y), 독립변수(설명변수, x), 산점 - 산점도에서 확인 할 수 있는 것 * 두 변수 사이의 선형 관계가 성립하는가? * 두 변수 사이의 .. 2021. 11. 8.
빅데이터가 만들어내는 본질적인 변화 빅데이터에서 중요시 여기는 부분이 과거에서 현재로 어떻게 변화되어 가는지 알 수 있다. 과거에서 현재로의 변화 사전처리 -> 사후처리 필요한 정보만 수집하고 필요하지 않은 정보는 버리는 시스템에서 가능한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아낸다. 표본조사 -> 전수조사 데이터 수집 비용의 감소와 클라우드 컴퓨팅 기술의 발전으로 데이터 처리비용이 감소하게 되었다. 이로 인해 표본을 조사하는 기존의 지식발견 방식에서 전수조사를 통해 샘플링이 주지 못하는 패턴이나 정보를 발견하는 방식으로 데이터 활용방법이 변화되었다. 질 -> 양 데이터가 지속적으로 추가될 경우 양질의 정보가 오류 정보보다 많아 전체적으로 좋은 결과 산출에 긍정적인 영향을 미친다는 추론에 바탕을 둔 변화가.. 2021. 9. 25.
반응형