Advanced Analytics

개념
- 데이터의 숨겨진 패턴을 찾아서 과거와 현재의 비즈니스 현상을 깊게 이해하고 미래 상황을 예측함으로써, 선제적인 의사결정을 지원하는 차세대 데이터 분석 기술

Ⅰ. 경영성과의 신속한 제공을 위한 Advanced Analytics의 개요

가. 미래 상황에 대한 예측을 위한 Advanced Analytics의 개념

  • 데이터의 숨겨진 패턴을 찾아서 과거와 현재의 비즈니스 현상을 깊게 이해하고 미래 상황을 예측함으로써, 선제적인 의사결정을 지원하는 차세대 데이터 분석 기술

 

나. Advanced Analytics의 필요성

  • SNS 활용 증가 : 외부 Data의 폭발적 증가로 발생 Data 패턴 분석필요
  • 마케팅 정보활용: 패턴을 통한 선제적 의사결정으로서 마케팅 정보활용

 

 

Ⅱ. Advanced Analytics의 기술분류 및 기술요소

가. Advanced Analytics의 기술분류

분석기술

설명

실시간 분석

- Real-Time Analytics

- 적시에 신속한 대응을 가능케 하는 분석기술

컨텍스트 분석

- Context Analytics

- 비정형 데이터를 분석 (PPT, 화상데이터, 회의록 등)

예측 분석

- Predictive Analytics

- 예측분석 통해 선제적 의사결정을 지원

 

 

나. Advanced Analytics의 기술요소

요소 기술

설명

데이터마이닝, ETL

데이터준비->모델개발->모델적용

설명 모델

분류와 군집(k-means), 순차적 패턴,

연관규칙(지지도, 신뢰도, 향상도, 장바구니분석)

텍스트 분석

데이터 유형(구조적, 반구조적(문서파일),

비구조적(비정형) 데이터, 메타데이타,

기법(통계적, 기계학습(지도/비지도), 자연어처리)

정보 검색

관련성, 확률적 정보추출

예측 모델

선형회귀, 신경망, 의사결정트리, 회귀트리

 

 

Ⅲ. 빅데이터 기반의 Advanced Analytics 분석기술 및 실시간 분석 기술요소

가. 빅데이터 기반의 Advanced Analytics 분석기술

분석 기술

설명

인터페이스

REST, Map/Reduce, GET/PUT, Thrift, API

데이터 모델

key-value, 컬럼, 문서, 그래프 기반

분산모델

CP(일관성 중시), AP(응답성 중시)

데이터 지속성

메모리/디스크/하이브리드

ACID 단순화

단일키, Only Insert, Join 지양

 

나. 실시간 분석기술요소의 Key Point

실시간 분석기술

설명

인메모리 기술

64bit 주소공간, 멀티코어, 복수블레이드 , SCM, MPP, CDC, 압축, 파티셔닝, 행+열기반 저장방식

스트리밍 DBMS

CQL,CEP, DDS

분산모델

CP(일관성중시), AP(응답성중시)

인터페이스

REST, Map/Reduce, GET/PUT, Thrift, API

데이터 모델

key-value, 컬럼, 문서, 그래프 기반

분산모델

CP(일관성중시), AP(응답성중시)

데이터 지속성

메모리/디스크/하이브리드

ACID 단순화

단일키, Only Insert, Join 지양

 

 

Ⅳ. Advanced Analytics 도입 요건 및 방향

가. Advanced Analytics 도입 요건

  • Data : DW, ETL, BI 등 필요한 데이터 식별 및 수집
  • Clean Data : 왜곡/누락 방지, 파싱/개선/변환(형식/수치/코드)
  • 모델구축->테스팅->확인 반복프로세스
  • 운영 데이타 관리 인프라: 메타데이타, MDM, 운영데이타 스토리지등

 

나. Advanced Analytics 의 방향

  • 고급분석은 새롭게 제시된 개념 및 솔루션이 아닌 만큼 실무 비즈니스에 적용하려면 더 많은 고민과 이슈를 해결해야 할 것임
  • 시장전망은 Core BI(전통적인 BI영역)에 비해 여전히 낮은 비중을 차지하고 있지만 성장세로 볼 때 실제 Core BI를 이끌 견인차 역할을 고급분석(Advanced Analytics)이 담당하게 될 것임.

댓글