본문 바로가기

EDU

5차시. 빅데이터 서비스를 위한 워밍업 - 모델 수립

차시목표
1. 빅데이터 서비스 목표에 따라 적용 영역에 적합한 분석 모델을 발굴할 수 있다
2. 빅데이터 분석 모델에 대하여 활용 목적에 부합한 서비스 모델을 정의할 수 있다
3. 서비스 모델에 대하여 사용자별 활용 시나리오를 정의할 수 있다
4. 시나리오에 따른 서비스 모델의 고려 사항과 제약 사항을 도출할 수 있다.
주요내용
1. 빅데이터 서비스 모델의 사용자 요구 사항의 이해 학습하기 2. 요구 사항 분석에 따른 분석 및 활용 목적과 절차의 이해 학습하기 3. 빅데이터의 서비스 활용에 따른 관리적 측면의 이해 학습하기 4. 빅데이터 서비스 모델의 수립 과정

 

■ 빅데이터 서비스를 위한 워밍업 - 모델 수립

1 빅데이터 서비스 모델의 사용자 요구 사항의 이해

● 빅데이터 서비스 모델

- 빅데이터 서비스의 참조 모델 3가지
① 정보 저장형: 다양한 빅데이터를 기반으로 정보기술 자원을 효율적으로 저장하여 활용하는 모델입니다. 

② 정보 제공형: 데이터를 융합하여 다양한 업무 및 서비스에 제공하는 모델입니다. 

③ 데이터의 이상 탐지 제공형: 데이터의 이상 탐지를 기반으로 보안적인 업무와 이상 탐지를 활용하는 모델입니다. 

 

● 정보의 활용

① 데이터 생성의 예
- 데이터를 가공한 결과물을 ‘정보’라고 정의합니다. 정보는 다음과 같은 네 가지 형태로 나눌 수 있습니다. 데이터는 다양한 원천기반에서 발생하는 데이터의 세트를 의미하며, 이러한 데이터 생성의 예는 다음과 같습니다. 

- 트랜잭션 위주의 데이터
- 구매 등과 관련된 거래 데이터
- 상품과 관련된 각종 관련 데이터 

- 배송업체의 인계 데이터 각종 업무 처리와 관련된 데이터 등 다양한 데이터 등이 발생하게 됩니다. 이러한 데이터가 수집되고 원천 데이터로 저장되어 패턴이 있는 정보의 형태로 가공됩니다. 

② 빅데이터 서비스 모델 생성의 과정
- 데이터는 빅데이터를 통해 향후 인공지능으로 진전하는 데에 가장 중요한 기반 구조가 된다. 

- 이러한 데이터의 효율적인 수집 및 가공으로 인해 패턴을 가진 의미 있는 데이터의 구조를 형성하게 된다
- 이러한 정보는 데이터에 관한 일반적인 공식이나 경험을 통해 지식으로 발전하게 된다. 

 

● 빅데이터 서비스 모델의 사용자 요구 사항의 이해와 관련하여 정보 예측
- 정보에 기반을 둔 서비스별 특성이 더해져서 예측의 정확도가 높아진다
- 데이터, 정보, 지식은 데이터의 영역이고 빅데이터를 중심으로 한 인공지능의 영역인 지혜의 영역까지 보조해 주는 중요한 영역이다. 

- 지혜는 빅데이터를 기반으로 하는 다양한 서비스가 딥러닝이나 머신 러닝 등의 학습을 통해 원천 데이터가 지혜의 영역, 즉 인공지능의 영역으로 발전하게 되는 것이다. 

 

가. 분석의 단위
- 데이터 분석에서 분석의 기본 단위를 분석 단위(unit of analysis)라고 합니다. 데이터 중에서 표본(sample)을 추출하고 분석하여 모집단의 특성을 추론해 내는 것을 통계학이라고 정의합니다. 또 이러한 모집단의 특성인 패턴을 찾아내는 기본 단계를 분석의 단위라고 정의합니다
  

 2. 분석 전략 계획의 수립 단계

① 자가진단을 통한 분석 준비 및 성숙도를 진단 - 현재 내부의 데이터에 대한 역량을 파악하는 부분으로서 이 부분에 대한 다양한 진단이 분석 전략 계획을 수립하는 데 매우 중요 합니다. 또 내부 분석의 수준을 파악하는 기초 자료입니다. 

② 분석에 요구되는 필요 사항의 발굴 - 현재 내부의 데이터에 대한 분석을 하는 데에 요구되는 필요 역량을 파악하는 부분으로서 필요 사항을 발굴하는 것입니다. 분석에 필요한 실제적인 구체화 및 실행의 단계를 의미합니다. 

③ 지식의 내재화
- 다양한 산업별 특성에 기인한 적용 사례를 발굴하여 해당 서비스의 모델에 맞게 내재화를 하는 부분입니다. 지식의 내재화가 잘 이루어져 있다면 향후 빅데이터 서비스 모델을 기획할 때에 매우 효율적으로 작업에 임할 수 있습니다. 지식의 내재화를 위한 영역은 각각 데이터, IT적 시스템, 업무 등이 포함됩니다. 

④ 사고의 내재화
- 데이터를 기반으로 하는 분석적 사고의 내재화를 의미합니다. 조직 내부적으로는 분석의 가치를 이해하고 분석 능력을 강화하는 영역이 포함되는 것입니다. 

⑤ 페르소나 분석
- 특정 서비스에 활용할 만한 목표 인구의 집단에서 구성되어 있는 다양한 사용자의 유형들을 대표하는 모집단을 도출하는 것을 페르소나 분석이라고 합니다. 이러한 페르소나 분석을 수행하기 위해서는 데이터를 수집하고 페르소나의 개수를 설정한 뒤에 데이터를 분석하여 분류하는 작업을 거치게 됩니다. 페르소나 분석 모델을 수립하기 위해서는 계획하는 서비스에 기반을 둔 데이터를 중심으로 특정 영역을 대표하는 모집단을 구성합니다. 이후에는 공통적으로 포함된 요소를 추출하여 대표적인 가상 모델을 만들어 활용합니다. 예를 들어, 강남에 거주하는 특정 나이나 직업 등을 설정하여 모집단을 만들어 마케팅에 활용하는 것을 페르소나 분석이라고 합니다.

 

3. 빅데이터의 서비스 활용에 따른 관리적 측면의 이해

- 비정형 데이터의 활용 측면에서 각종 분석 알고리즘 및 통계적 분석과의 차이점을 이해해야 합니다. 이는 서비스 모델을 수립하기 전에 어떤 종류의 데이터를 가지고 있는지, 어떤 종류의 추론인지, 어떤 종류의 분석 기법을 이용해 서비스 모델을 수립할 것 인지를 정의하는 기본 정보로서 고려 사항에 반드시 포함되어야 합니다. 

 

• 분석 전략 계획을 수립할 때의 자가진단 체크리스트

 

① 데이터의 가치 측면
- 데이터의 가치를 이해하고 있는가?
- 데이터를 활용하려는 의지가 있는가?
② 데이터의 조직 측면 - 데이터를 분석 및 활용할 부서가 있는가?
- 빅데이터를 전략적으로 추진할 부서가 있는가?
③ 데이터의 활용 측면 - 기업 및 조직 측면에서 데이터를 활용할 역량이 있는가?
- 기업 및 조직 측면에서 데이터에 대한 이해도가 있는가?
④ IT적인 측면
- 물리적인 빅데이터 시스템이 있는가?
- 빅데이터와 관련된 운영 경험이 있는가?
 ⑤ 거버넌스 측면
- 데이터와 관련된 기업 전체의 거버넌스가 구축되어 있는가?
- 빅데이터 거버넌스에 대한 최고 경영자의 의지가 있는가?
⑥ 보안 측면
- 데이터에 대한 보안 체계를 준수하고 있는가?
- 데이터에 대한 보안의 중요성을 인식하고 있는가?


4. 빅데이터 서비스 모델의 수립 과정

- 빅데이터 서비스에 따른 적용 모델은 활용 목적에 부합하여 실질적인 성과가 나타나기 때문에 명확한 적용 계획을 수립하는 것이 매우 중요합니다. 뿐만 아니라 반드시 데이터 분석을 통한 정성적인 부분에서도 정확한 분석을 통해 적용 서비스의 명확한 근거가 필요한 것을 전제로 합니다. 서비스 모델을 수립하기 위해서는 원가 절감의 측면, 영업력 강화의 측면, 데이터의 융합을 통한 혁신적인 서비스 및 제품의 개발 측면에서의 검토가 필요합니다. 

 

● 모델 활용의 구분

- 원가를 절감하기 위한 서비스 모델인지의 여부는 기업 내에 존재하는 각종 공정을 효율적으로 배치하는 것이 활용 가능한지의 여부와 관련이 있습니다. 이 부분은 제조 공정에서 빅데이터를 활용한 다양한 접근 방법에 대한 시도이며, 효율적인 공정을 설계한다면 다양한 부분에서 활용이 가능합니다. 예를 들어, 생산 공정에서의 설비 및 부품, 원재료의 절감을 획기적으로 절감하는 측면이 있으며, 이것은 생산 인력의 효율적인 배치와도 관련이 매우 깊습니다. 특히, 사물인터넷 기술 및 통신망의 발전으로 인해 각종 제조 공정에서 발생하는 데이터를 수집하고 저장하여 활용한다면 품질 관리, 설비와 생산의 영향, 각종 품질 불량률의 예측 등의 다양한 부분에서 활용이 가능합니다. 

● 특정 서비스 모델의 적용
- 영업 경쟁력 확보의 서비스 모델에 대한 적용 부분입니다. 빅데이터 서비스 모델을 발굴하는 측면에서 백화점이나 마트 등을 중심으로 하는 유통업, 기타 도소매업 및 온라인 유통 기업에서 모델을 적용해 활용할 수 있습니다. 그리고 새로운 제품을 연구 개발하여 출시할 경우에는 영업의 경쟁력을 확보하는 서비스 모델로 많이 활용합니다. 

● 비즈니스의 창출
- 데이터의 융합을 통해 혁신적인 비즈니스를 창출하는 부문입니다. 이 부문은 데이터를 통해 융합을 한다면 새로운 제품을 기획하거나 서비스를 기획할 경우 종래의 영역에서는 보지 못했던 다양한 접근이 가능합니다. 이와 같이 기존의 산업군이 다양한 융합을 거치면서 새로운 부문으로 진화하고 있기 때문에 융합이라는 키워드가 매우 중요해지고 있습니다.

 

빅데이터 서비스 참조 모델 중 정보 저장형은 다양한 빅데이터를 기반으로 정보 기술 자원을 효율적으로 저장하여 활용하는 모델이다.O
[해설] 빅데이터를 기반으로 하는 서비스의 산업별 또는 업무별로 다양한 모델들이 있습니다.
① 정보 저장형: 다양한 빅데이터를 기반으로 정보기술 자원을 효율적으로 저장하여 활용하는 모델입니다.
② 정보 제공형: 데이터를 융합하여 다양한 업무 및 서비스에 제공하는 모델입니다.
③ 데이터의 이상 탐지 제공형: 데이터의 이상 탐지를 기반으로 보안적인 업무와 이상 탐지를 활용하는 모델입니다.
다양한 데이터 소스에 기반을 둔 대용량, 비정형 데이터를 통한 패턴 인식 기반의 귀납적 추론의 접근 방법을 이해해야 한다.X
[해설] 다양한 데이터 소스에 기반을 둔 대용량, 비정형 데이터를 통한 패턴 인식 기반의 연역적 추론의 접근 방법을 이해해야 합 니다. 특히, 대용량 데이 터만이 가지는 속성을 이해하고, 이에 따른 심도 있는 분석 결과를 도출하기 위한 데이터의 각종 오류를 제거해야 할 필요가 있습니다. 이는 이후에 적용될 서비스 모델의 예측 분석을 높이기 위한 다양한 학습 모델의 기 반이 됩니다.
원가를 절감하기 위한 서비스 모델인지의 여부는 기업 내에 존재하는 각종 공정을 효율적으로 배치하는 것이 활용 가능한지의 여부와 관련이 있다. O
[해설] 원가를 절감하기 위한 서비스 모델인지의 여부는 기업 내에 존재하는 각종 공정을 효율적으로 배치하는 것이 활용 가능 한지의 여부와 관련이 있습니다. 이 부분은 제조 공정에서 빅데이터를 활용한 다양한 접근 방법에 대한 시도이며, 효율 적인 공정을 설계한다면 다양한 부분에서 활용이 가능합니다