분석 유스 케이스
- 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석
문제로의 전환 및 적합성 평가에 활용하도록 하는 것
- 기업은 전사 또는 개별 업무별 주요 의사결정 포인트에 활용할 수 있는 분석의 후보
- 비즈니스 모델을 구성하는 이론을 설명하며, 하나 이상의 분석을 포함하고 프로세스 혁신의 수단으로 사용
- 현재의 비즈니스 모델, 유사 및 동종 사례 탐색을 통해서 빠짐없이 도출한 분석 기회들을 구체적인 과제로 만들기에
앞서 표기하는 것이 필요
분석 마스터프랜
- 기업 또는 기관의 전사 차원에서 식별된 다양한 분석 과제를 대상으로 제한된 예산과 지원을 효과적으로 수행하기
위하여 우선순위를 평가하고, 평가 결과에 따른 단계별 군현 로드맵을 수립하는 실행 계획이다.
분석 준비도
- 빅데이터 분석을 도입하기에 앞서 현재 기업의 분석 수준을 명확하게 파악하는 것이 중요
- 진단을 통한 향후 분석 목표 및 방향성 수립을 위해 진단하는 6가지 평가 영역
- 분석업무, 분석 인력 및 조직, 분석 기법, 분석 데이터, 분석 문화, 분석 인프라는 6가지 평가 영역
소프트 스킬
- 데이터 사이언티스트가 갖춰야 할 역량은 빅데이터의 처리 및 분석에 필요한 이론적 지식과 기술적 숙련과 관련된
능력인 하드 스킬과 데이터 속에 숨겨진 가치를 발견하고 새로운 발전 기회를 만들어 내기 위한 능력인
소프트 스킬로 나누어짐
- 가트너가 제시한 역량 중 커뮤니케이션, 협력, 리더십, 차으이력, 규율, 열정 등을 통칭하여 소프트 스킬
데이터 준비
- 데이터 분석 방법론 중 KDD는 데이터 전처리에 분석 대상용 데이터 셋에 포함되어 있는 잡음과 이상치, 결측치를
식별하고 필요시 제거하거나 의미 있는 데이터로 처리하는 데이터셋 정제 작업을 시행
- CRISP-DM 단계 중 분석을 위하여 수집된 데이터에서 분석기법에 적합한 데이터에 편성하는 단계로써 많은 시간이
소요, 분석용 데이터 셋 선택, 데이터 정제, 분석용 데이터 셋 편성, 데이터 통합, 데이터 포맷팅이 이 단계 해당됨
프레이밍 효과
- 동일한 사안이라고 해도 제시되는 방법에 따라 그에 관한 해석이나 의사결정이 달라지는 인식의 왜곡된 현상
하향식 접근 방식
- 문제가 먼저 주어지고 해담을 찾기 위한 과정을 체계적으로 단계화하여 수행하는 방식
- 분석 과제를 도출하기 위한 접근방식으로 과정에 체계적이고 단계적으로 수행되는 방식
상향식 접근 방식
- 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제의 재정 및 해결방안을 탐색하고 이를 지속적으로
개선하는 방식
- 시행착오를 통한 문제 해결인 프로토타이핑 접근법
- 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 모든 문제를 도출하는 일련의 과정
- 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선하는 방식
모델링
- CRISP-DM 단계 중 Training Data와 Test Data를 평가하여 모델 과적합 등 문제를 발견하고 대응 방안을 마련하는 단계
- 데이터 분석 방법론, 머신러닝을 이용한 수행 모델을 만들거나 데이터를 분할하는 부분
프로토타이핑
- 기법은 신속하게 해결책 모형을 제시 및 상향식 접근방법을 활용
- 접근법은 사용자가 요구 사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운
상황에서 일반 분석을 시도해보고 그 결과를 확인해가면서 반복적으로 개선해 나가는 방법
- 방법론은 비록 완전하지는 못한다 해도 신속하게 해결책이나 모형을 제시함으로써 이를 바탕으로 좀 더 명확하게
인식하고 필요한 데이터를 식별하고 구체화할 수 있게 하는 유용한 상향식 접근 방식
- 접근법의 기본적인 프로세스는 가설의 생성 디자인에 대한 실험, 실제 환경에서의 테스트, 테스트 결과에서의
통찰 도출 및 가설 확인으로 구성
나선형 모델
- 여러 번의 개발 과정을 거쳐 점진적으로 프로젝트를 완성시켜가는 모델
- 대규모 시스템 소프트웨어 개발에 적합
정보전략계획 (ISP)
- 기업 및 공공기관에서는 시스템의 중장기 로드맵을 정의하기 위함
- 정보기술 또는 정보시스템을 전략적으로 활용하기 위하여 중장기 마스터플랜을 수립하는 절차
- 정보기술 또는 정보시스템을 전략적으로 활용하기 위하여 조직 내외부 환경을 분석하여 기회나 문제점을 도출하고
사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차
애자일
- 방법론은 폭포 수형 모델에 반대되는 개념으로 탄생한 방법론으로 폭포수 모델은 프로젝트 개발 계획을 정해두고
각각의 단계별로 개발을 진행하는 형태의 개발 방법론
- 문제가 생긴다면 처음부터 다시 각각의 단계를 진행해야 함
분석 마스터플랜
- 전사 차원에서 식별된 다양한 분석 주제 또는 과제를 대상으로 적용의 우선순위를 선정하고, 이를 실행하기 위한 구체적인 일정 계획, 단계적 구현 로드맵, 소요 인력, 예산 등 실행 계획을 수립하는 과정
- 기업 또는 기관의 전사 차원에서 식별된 다양한 분석 과제를 대상으로 제한된 예산과 자원을 효과적으로 수행하기 위하여 우선순위를 평가하고, 평가 결과에 따른 단계적 구현 로드맵을 수립하는 실행 계획
EDA
- 데이터가 가지고 있는 특성을 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 분석
- 다양한 차원의 값을 조합해 가며 특이점이나 의미 있는 사실을 도축하고 분석의 최종 목적을 달성해가는 과정
- 또한 빅데이터 시대가 도래하면서 데이터 양이 많아지면서 더욱더 활용이 많아 짐
- 분석용 데이터셋에 대한 정합성 검토, 데이터 요약, 데이터 특성을 파악하고 모델링에 필요한 데이터를 편성
- 데이터 시각화 과정도 이때에 수행될 수 있음
- 데이터 분포 확인, 변수 간 연관성 분석 등을 수행
데이터 거버넌스
- 전사 차원의 모든 데이터에 대해여 정책 및 지침, 표준화, 운영조직 및 책임 등의 표준화된 관리 체계를 수립하고
운영을 위한 프레임 워크 및 저장소를 구축하는 것
- 마스터 데이터, 메타 데이터, 데이터 사전의 중요한 관리 대상
- 기업은 체계를 구축함으로써 데이터의 가용성, 유용성, 통합성, 보안성, 안전성을 확보
마스터 데이터
- 자주 변하지 않고 처리 운영에 기본 자료로 제공되는 자료의 집합으로 인사 데이터에 이름, 생년월일 등이 해당
될 수 있는 데이터
분석 과제 정의서
- 향후 프로젝트 수행계획의 입력 물로 사용하기 때문에 프로젝을 수행하는 이해관계자가 프로젝트 방향을 설정하고
성공 여부를 판별할 수 있는 주요한 자료로서 명확하게 작성되어야 함
- 분석 별로 필요한 소스 데이터, 분석 방법, 데이터 입수 및 분석도 난이도, 분석 수행 주기, 분석 결과에 대한 검증
오너쉽, 상세 분석 과정 등을 정의
분석 성숙도 모델 (도입, 활용, 확산, 최적화)
- 도입은 분석 성숙도 모델 중 분석을 시작하여 환경과 시스템을 구축하는 단계
- 실적 분석 및 통계, 정기보고 수행, 운영 데이터 기반이 있음
- 활용은 분석 성숙도 모델 중 분석 결과를 실제 업무에 적용하는 단계
- 미래 결과를 예측하며 시뮬레이션, 운영 데이터를 기반으로 한다.
- 확산은 분석 성숙도 모델 중 빅데이터 관리를 위한 환경이 갖추어지고, 전사 차원에서 분석을 관리하고 공유하며,
이를 위해 분석 전문 조직을 운영하는 수준의 성숙단계
- 최적화는 분석 성숙도 모델 중 분석을 진화시켜서 혁신 및 성과 향상에 기여하는 단계
- 외부 환경 분석에 활용하여 최적화 업무 적용하고, 실시간 분석 및 비즈니스 모델 진화를 기반으로 함
기능형 구조
- 일반적인 분석 수행 구조로서 별도 분석조직이 없고 해당 업무 부서에서 분석을 수행
- 전사적 핵심 분석이 어려우며 부서 현황 및 실적 통계 등 과거 실적에 국한된 분석 수행 가능성이 높음
집중형 구조
- 분석 조직구조의 유형 중 기업 내 별도의 독립적인 전담 조직이 전략적 중요에 따라 분석 우선순위를 정해서
추진할 수 있는 조직구조
- 현업 업무부서의 분석업무와 이중화/이원화 가능성이 높음
분산형 구조
- 분석 조직구조의 유형 중 분석조직 인력들을 현업부서로 직접 배치하여 분석업무를 수행하고, 분석 결과에 따른
신속한 액션이 가능한 구조
- 베스트 프랙티스 공유 가능하며 부서 분석 업무와 역할 분담을 명확히 해야 하는 구조
지도 학습
- 명확한 목적 하에 데이터 분석을 실시하는 것을 말하며, 분류, 추축, 예측, 최적화를 통해 사용자의 주도하에
분석을 실시하고 지식을 도출하는 것이 목적
- o와 x를 구분 짓게 하는 분류
- 결과로 도출되는 값에 대하여 사전에 인지하고 어떠한 데이터를 넣었을 때 어떠한 결과가 나올지를 예측
비지도 학습
- 상향식 접근 방식의 데이터 분석
- 데이터 분석의 목적이 명확히 정의된 형태의 특정 필드의 값을 구하는 것이 아니라 데이터 자체의 결합, 연관성,
유사성 등을 중심으로 데이터의 상태를 표현하는 것
- 데이터 마이닝 기법의 예로는 장바구니 분석, 군집 분석, 기술 통계 및 프로파일링 등 이 있음
- 목표 값을 사전에 정의하지 않고 데이터 자체만을 가지고 그룹들을 도출함으로써 해석이 용이하지는 않지만 새로운
유형의 인사이트를 도출하기에 유용한 방식으로 활용할 수 있음
비즈니스 모델
- 시장에서 경장자의 활동들과 다른 활동들을 수행하거나 유사한 활동들을 다른 방식으로 수행하여 자사가 경쟁사보다
경쟁 우위를 갖기 위한 것을 말함
- 기업 운영 방식의 표현, 하나의 조직이 가치를 어떻게 만들고, 제공하며, 획득하는지에 대한 근본적 원리의 표현,
기업을 어떻게 경영하느냐를 설명하는 이야기의 정의들이 공통적으로 설명하는 것을 말함
분석기획
- 기업의 비즈니스 모델 분석을 통해 경쟁력 강화를 위한 핵심을 식별
- 특성 대상 프로세스를 선정한 후 업무 주제별로 분석 요건을 식별
- 핵심 프로세스들과 그것을 통한 의사결정, 그리고 더 정교하고 뛰어나 분석으로 혜택을 얻을 수 있는 업무 의사
결정들을 체계적으로 조사
- 제공되는 산업별, 업무 서비스 별 분석 테마 후보 풀의 벤치마킹을 통해 식별
분석 정의서
- 분석 활용 시나리오와 분석 체계를 보다 상세히 나타내는 방법으로 분석 별로 필요한 소스 데이터, 분석방법, 데이터
입수 및 분석의 난이도, 분석 수행 주기, 분석 결과에 대한 검증 오너십, 상세 분석 과정을 정의하는 방법
사분면 분석
- 분석 관점에서 4가지 유형으로 분석 수준진단 결과를 구분하고 향후 고려해야 하는 데이터 분석 수준에 대한 목표
방향을 정의하고 유형별 특성에 따라 개선방안을 수립하는 방법
데이터 거버넌스 구성요소 (원칙, 조직, 프로세스)
- 데이터 거버넌스 구성요소로는 원칙, 조직, 프로세스 유기적인 조합을 통하여 데이터를 비즈니스 목적에 부합하고
치적의 정보서비스를 제공할 수 있도록 효과적으로 관리
- 원칙은 데이터를 유지 관리하기 위한 지침과 가이드이며 보안, 품질, 기준, 변경관리
- 조직은 데이터를 관리할 조직의 역할과 책임이며 데이터 관리자, 데이터베이스 관리자, 데이터 아키텍트가 있음
- 프로세스는 데이터 관리를 위한 활동과 체계이며 작업 절차, 모니터링 활동, 측정 활동이 있음
분석 거버넌스 체계
- 빅데이터 시대에 진입하면서 기업의 분석 수준 및 목적에 맞게 데이터를 분석하여 적용하는 것이 궁극적으로
기업의 경쟁력이 될 수 있기 때문에 기업 데이터의 체계적인 관리가 필수적
- 조직 내의 분석을 효율적이고 안정적으로 적용하기 위해서는 기업에 적합한 형태의 데이터 분석 전문조직을
구성하고 분석 전문 인력을 양성하는 것이 매우 중요함
- 분석 전문 인력을 양성하기 위해 조직 구성원을 대상으로 분석 교육을 실시하며 분석을 조직의 문화로 정착시키기
위한 변화관리 노력이 필요
'데이터분석' 카테고리의 다른 글
[데이터 분석] 어떤 지표를 볼 것인가? (0) | 2024.11.11 |
---|---|
[데이터 분석] 저장된 데이터 확인하기 (0) | 2024.09.29 |
데이터의 이해 (0) | 2021.11.16 |
연관분석 (0) | 2021.11.15 |
분류분석 (0) | 2021.11.14 |