[ADsP] 2과목 데이터 분석 기획 - 1장 데이터 분석기획의 이해 (2)

Study/ADSP

[ADsP] 2과목 데이터 분석 기획 - 1장 데이터 분석기획의 이해 (2)

tnddj1219 2022. 3. 2. 22:40
728x90

정리 내용은 [2022 ADsP 데이터 분석 준전문가]책을 기반으로 작성하였습니다.

 

2022 ADsP 데이터 분석 준전문가 - 교보문고

본 도서는 한국데이터베이스진흥원에서 실시하고 있는 『데이터 분석 전문가(ADP)』 자격증과 『데이터 분석 준전문가(ADsP)』 자격증을 준비하는 수험생들을 위한 도서이다. 2014년 4월 이후 시행

www.kyobobook.co.kr


3. 분석 과제 발굴

1. 분석 과제 발굴 방법론

분석 과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 관계자들이 이해하고 프로젝트로 수행할 수 있는 과제 정의서 형태로 도출
분석과제를 도출하기 위한 방식으로는 크게 하향식 접근방법과 상향식 접근 방법이 있다.
분석 과제 발굴을 두 가지 방식으로 나누었지만,
 실제로 새로운 상품 개발이나 전략 수립 등 중요한 의사 결정을 할 때 하향식 접근 방법과 상향식 접근 방법이 혼용되어 사용되며 분석의 가치를 높일 수 있는 최적의 의사결정은 두 접근 방식이 상 보완 관계에 있을 때 작용

* 디자인 사고: 상향식 접근 방식을 발산 단계와 하향식 접근 방식의 수렴 단계를 반복적으로 수행하는 식의 상호 보완적인 동적 환경을 통해 분석의 가치를 높일 수 있는 최적의 의사결정 방식

2. 하향식 접근법

문제가 주어져 있는 상태에서 답을 구하는 전통적인 방식
대규모의 다양한 데이터를 생성하고 빠르게 변하는 기업 환경에서는 문제 자체의 변화를 심해 정확하게 문제를 사전에 정의하는 것이 어려워짐
문제 탐색(Problem Discovery), 데이터 문제로 정의(Problem definition), 해결방안을 탐색(Solution Search), 데이터 분석의 타당성 평가(Feasibility Study)라는 단계를 거쳐 분석 과제를 도출하는 과

 

문제 탐색 단계
전체적인 관점의 기준 모델을 활용하여 빠짐없이 문제를 도출하고 식별하는 것이 중요

전체적인 관점의 기준 모델로는 기업 내외부 환경을 포괄하는 비즈니스 모델과 외부 참조 모델이 존재

문제를 해결함으로써 발생하는 가치에 중점
1) 비즈니스 모델 기반 문제 탐색

기업 내외부 환경을 포괄하고 있는 비즈니스 모델이라는 틀을 활용하여 비즈니스 모델 캔버스 9가지 블록을 단순화하여 업무, 제품, 고객 단위로 문제를 발굴하고 이를 관리하는 두 가지 영역인 규제와 감사 영역과 지원 인프라 영역에 대한 기회를 추가로 도출하는 작업 수행

현재 사업을 영위하고 있는 환경, 경쟁자, 보유하고 있는 역량, 제공하고 있는 시장을 넘어서 거시적 관점의 요인, 경쟁자의 동향, 시장의 니즈 변화, 역량의 재해석 등 새로운 관점의 접근을 통해 새로운 유형의 분석 기회 및 주제 발굴을 수행해야 함

과제발굴방법 내용
업무
(Operation)
제품 및 서비스를 생산하기 위해서 운영하는 내부 프로세스 및 주요 자원 관련 주제 도출
(ex. 생산 공정 최적화, 재고량 최소화)
제품
(Product)
생산 및 제공하는 제품, 서비스를 개선하기 위한 관련 주제 도출
(ex. 
제품의 주요 기능 개선, 서비스 모니터링 지표 도출)
고객
(Customer)
제품 서비스를 제공받는 사용자 및 고객, 이를 제공하는 채널의 관점에서 관련 주제 도출
(
ex. 고객 콜 대기 시간 최소화, 영업점 위치 최적화)
규제와 감사
(Regualtion & Audit)
제품생산 및 전달과정 프로세스 중 발생하는 규제 및 보안의 관점에서 주제 도출
(ex.
 제공하는 서비스품질 이상징후관리, 새로운 환경규제 시 예상되는 제품추출 등)
지원 인프라
(IT & Human Resources)
분석을 수행하는 시스템 영역 및 이를 운영 관리하는 인력의 관점에서 주제 도출
(
ex. EDW 최적화, 적정 운영 인력 도출 등)

2) 분석 기회 발굴의 범위 확장
거시적 관점의 메가 트렌드: 조직 및 해당 산업을 폭넓게 영향을 미치는 사회, 경제적 요인을 STEEP로 요약되는 Social, Technological, Economic, Environmental, Political 영역으로 폭넓게 나눔

영역 내용
Social
(사회)
비즈니스 모델의 고객 영역에 존재하는 현재 고객을 확장하여 전체 시장을 대상으로 사회적, 문화적, 구조적 트랜드 변화에 기반한 분석 기회를 도출
(ex. 노령화, 밀레니엄 세대 등장, 저출산에 따른 사업모델 변화)
Technological
(
기술)
과학, 기술, 의학 등 최신 기술의 등장 및 변화에 따른 역량 내 재화와 제품 서비스 개발에 대한 분석기회 도출 (ex. 나노기술, IT 융합기술, 로봇 기술의 고도화로 인한 제품의 Smart화)
Economic
(경
제)
산업과 금융 전반의 변동성 및 경제 구조 변화 동향에 따른 시장의 흐름을 파악하고 이에 대한 분석 기회를 도출 (ex. 원자재 가격, 환율, 금리 변동에 따른 구매전략의 변화 등)
Environmental
(
환경)
환경과 관련된 정부, 사회단체, 시민사회의 관심과 규제 동향을 파악하고 이에 대한 분석 기회를 도출
(ex. 탄소 배출 규제 및 거래 시장 등장에 따른 원가 절감 및 정보 가시화 등)
Political
(
정치)
주요 정책 방향, 정세, 지정학적 동향 등의 거시적인 흐름을 토대로 한 분석 기회를 도출
(ex. 대북관계 동향에 따른 원자재 구매 거래선의 다변화 등)

경쟁자 확대 관점: 현재 수행하고 있는 사업영역의 직접 경쟁사 및 제품, 서비스뿐만 아니라 대체제와 신규 진입자 등의 관점으로 확대하여 위험이 될 수 있는 상황에 대한 분석 기회 발굴의 폭을 넓혀서 탐색

영역 내용
대체재
(Substitute)
융합적인 경쟁 환경에서 현재 생산을 수행하고 있는 제품 서비스를 온라인으로 제공하는 것에 대한 탐색 및 잠재적 위험을 파악 
(ex. 오프라인 제공 서비스 -> 온라인 제공에 대한 탐색 및 잠재적 위험 파악)
경쟁자
(Competitor)
현재 생산하고 있는 제품, 서비스의 주요 경쟁자에 대한 동향을 파악하여 이를 고려한 분석 기회를 도출 
(ex. 식별된 주요 경쟁사의 제품, 서비스 카탈로그 및 전략 분석을 통한 잠재적 위험 파악)
신규 진입자
(New Entrant)
향후 시장에 대해서는 파괴적인 역할을 수행할 수 있는 신규 진입자에 대한 동향을 파악하여 이를 고려한 분석 기회를 도출 (ex. 새 제품에 대한 클라우드 소싱 서비스인 킥 스타터의 유사제품을 분석하고 잠재적 위험 파악)

시장의 니즈 탐색 관점: 현재 수행하고 있는 사업에서 직접 고객뿐만 아니라 고객과 접촉하는 역할을 수행하는 채널 및 고객의 구매와 의사결정에 영향을 미치는 영향자들에 대한 폭넓은 관점을 바탕으로 분석 기회를 탐색

영역 내용
고객
(Customer)
고객의 구매 동향 및 고객의 컨텍스트를 더욱 깊게 이해하여 제품, 서비스의 개선에 필요한 분석 기회 도출
(ex. 철강 기업의 경우 조선 산업과 자동차 산업의 동향 및 주요 거래선의 경영현황 등을 파악하고 분석기회 도출)
채널
(Channel)
영업사원, 직판 대리점, 홈페이지 등의 자체적으로 운영하는 채널뿐만 아니라 최종 고객에게 상품, 서비스를 전달하는 것에 가능한 경로를 파악하여 해당 경로에 존재하는 채널 별로 분석기회를 확대하고 탐색
(ex. 은행의 경우 인터넷 전문은행 등 온라인 채널의 등장에 따른 변화에 대한 전략 분석 기회 도출)
영향자
(Influencer)
기업 의사결정에 영향을 미치는 주주, 투자자, 협회 및 기타 이해 관계자의 주요 관심사항에 대해서 파악하고 분석기회를 탐색
(ex. M&A 시장확대에 따른 유사업종의 신규기업 인수 기회 탐색)

역량의 재해석 관점: 현재 해당 조직 및 기업이 보유한 역량뿐만 아니라 해당 조직의 비즈니스 영향을 끼치는 파트너 네트워크를 포함한 활동 가능한 역량을 토대로 폭넓은 분석 기회를 탐색

영역 내용
내부역량
(Competency)
지적 재산권, 기술력 등 기본적인 뿐만 아니라 중요하면서도 자칫 간과하기 쉬운 지식, 기술 등의 노하우와 인프라적인 유형 자산에 대해서 재해석하고 해당영역에서 분석기회를 탐색
(ex. 자사 소유 부동산을 활용한 부가가치 창출 기회 발굴)
파트너와 네트워크
(Partners
 & 
Network)
자사가 직접 보유하고 있지는 않지만 밀접한 관계를 유지하고 있는 관계사와 공급사 등의 역량을 활용해 수행할 수 있는 기능을 파악해보고 이에 대한 분석기회를 추가적으로 도출
(
ex. 수출입, 통관, 노하우를 활용한 추가 사업 기회 탐색)

3) 외부 참조 모델 기반 문제 탐색

유사, 동종 사례 벤치마킹을 통한 분석 기회 발굴은 제공되는 산업별, 업무 서비스별 분석 테마 후보 그룹을 통해 Quick

 & Easy 방식으로 필요한 분석 기회가 무엇인지에 대한 아이디어를 얻고, 기업에 적용할 분석 테마 후보 목록을 워크숍 형태의 브레인스토밍을 통해 빠르게 도출하는 방법
현재 환경에서는 데이터를 활용하지 않은 업종 및 업무 서비스가 사실상 존재하지 않기 때문에 데이터 분석을 통한 인사이트를 도출하고 업무에 활용하는 사례들을 발굴하고, 자사의 업종 및 업무 서비스에 적용하며 평상시 지속적인 조사와 데이터 분석을 통한 가치 발굴 사례를 정리하여 풀로 만들어 과제 발굴 및 탐색 시 빠르고 의미 있는 분석 기회 도출 가능
4) 분석 유즈 케이스

현재의 비즈니스 모델 및 유사 동종 사례 탐색을 통해서 빠짐없이 도출한 분석 기회들을 구체적인 과제로 만들기 전에 분석 유즈 케이스로 표기하는 것이 필요. 분석 유즈 케이스는 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용되도록 함

 

문제 정의 단계

식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계앞서 수행한 문제 탐색의 단계가 무엇(What)을 어떤 목적(Why)으로 수행해야 하는지에 대한 관점이었다면, 본 단계에서는 이를 달성하기 위해 필요한 데이터 및 기법(How)을 정의하기 위한 데이터 분석의 문제로의 변환을 수행)
예시: 고객 이탈 증대라는 비즈니스 문제-> 고객 이탈에 영향을 미치는 요인을 식별하고 이탈 가능성을 예측하는 데이터 분석 문제로 변환될 수 있다
데이터 분석 문제의 정의 및 요구사항: 분석을 수행하는 당사자뿐만 아니라 해당 문제가 해결되었을 때 효용을 얻을 수 있는 최종 사용자 관점에서 이루어져야 한다.
데이터 분석 문제가 잘 정의되었을 때 필요한 데이터의 정의 및 기법 발굴이 용이하기 때문에 가능한 정확하게 분석의 관점으로 문제를 재정의할 필요가 있다.

 

해결방안 탐색

정의된 데이터 분석 문제를 해결하기 위한 다양한 방안이 모색됨
기존 정보 시스템의 단순한 보완으로 분석이 가능한지 고려
- 엑셀 등의 간단한 도구로 분석이 가능한지 고려
하둡 등 분산 병렬 처리를 활용한 빅데이터 분석 도구를 통해 보다 체계적이고 심도 있는 방안 고려
분석 역량을 기존에 가지고 있는지의 여부를 파악하여 보유하고 있지 않은 경우에는 교육이나 전문인력 채용을 통한 역량을 확보하거나 분석 전문업체를 활용하여 과제를 해결하는 방안에 대해 사전 검토 수행

해결 방안 탐색 영역

타당성 검토
도출된 분석 문제나 가설에 대한 대안을 과제화하기 위해서는 다음과 같은 다각적인 타당성 분석이 수행되어야 한다.

경제적 타당성: 비용 대비 편익 분석 관점의 접근이 필요하다. 비용항목은 데이터, 시스템, 인력, 유지보수 등과 같은 분석비용으로 구성되고, 편익으로는 분석 결과를 적용함으로써 추정되는 실질적 비용절감, 추가적 매출과 수익 등과 같은 경제적 가치로 산출
데이터 및 기술적 타당성: 데이터 존재 여부, 분석 시스템 환경 그리고 분석 역량이 필요하다. 특히 분석 역량의 경우 실제 프로그램 수행 시 걸림돌이 되는 경우가 많기 때문에 기술적 타당석 분석 시 역량 확보 방안을 사전에 수립하고 이를 효과적으로 평가하기 위해서는 비즈니스 지식과 기술적 지식이 요구됨
위의 타당성 검토를 통해 도출된 대안을 통해
(1) 평가 과정을 거쳐 가장 우월한 대안을 선택한다.
(2)
도출한 데이터 분석 문제 및 선정된 솔루션 방안이 포함한다.
(3)
분석 과제 정의서의 형태로 명시하는 후속 작업을 시행한다.
(4)
프로젝트 계획의 입력 물로 활용한다.

3. 상향식 접근법

다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 모든 문제를 도출하는 일련의 과정
기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론
통게적 분석에는 인과관계 분석을 위해 가설을 설정하고 이를 검정하기 위해 모집 단로부터 표본을 추출하고 그 표본을 이용한 가설 검정을 실시하는 방식으로 문제를 해결하였다. 그러나 빅데이터 환경에서는 이와 같은 논리적인 인과관계 분석뿐만 아니라 상관관계 분석 또는 연관 분석을 통하여 다양한 문제 해결에 도움을 받을 수 있다.
인과관계로부터 데이터 분석을 통해서 왜그러한 일이 발생하는지 역으로 추적하면서 문제를 도출하거나 재정의 할 수 있는 것이 상향식 접근법이다.

 

하향식 접근방법의 한계
기존 접근방법인 논리적인 단계별 접근법은 문제의 구조가 분명하고 문제를 해결하고 해결책을 도출하기 위한 데이터 분석가 및 의사결정자에게 주어져 있음을 가정하고 있기 때문에 솔루션 도출에는 유효하지만 새로운 문제의 탐색에는 한계가 있다.
따라서 기존의 논리적인 단계별 접근법 기반의 문제 해결 방식은 최근 복잡하고 다양한 환경에서 발생하는 문제에는 적합하지 않을 수 있다.
이를 해결하기 위해 스텐포드 대학의 d.school은 디자인 사고 접근법을 통해 전통적인 분석적 사고를 극복하려고 한다.
통상적인 관점에서는 분석으로 사물을 인식하려는 why를 강조하지만 우리가 알고 있다고 가정하는 것이기 때문에 문제와 맞지 않은 솔루션인 경우 오류가 발생할 소지가 있다. 그렇기 때문에, 답을 미리 내는 것이 아니라 사물을 있는 그대로 인식하는 what 관점에서 보아야 한다는 것이다.
객관적으로 존재하는 데이터 그  자체를 관찰하고 실제적으로 행동에 옮김으로써 대상을 좀 더 잘 이해하는 방식으로 접근을 수행하는 것이다.

이와 같은 점을 고려하여 d.school 에서는 첫 단계로 감정이입을 특히 강조하고 있다.

 

비지도 학습과 지도 학습
비지도 학습: 일반적으로 상향식 접근방식의 데이터 분석은 비지도 학습 방법에 의해 수행됨. 데이터의 분석이 목적이 명확히 정의된 형태의 특정 필드의 값을 구하는 것이 아니라 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현하는 것 (ex. 장바구니 분석, 군집 분석, 기술통계 및 프로파일링 등)
지도 학습: 명확한 목적하에 데이터 분석을 실시하는 것. 분류, 추측, 예측, 최적화를 통해 사용자의 주도하에 분석을 실시하고 지식을 도출하는 것

지도 학습의 경우, 결과로 도출되는 값에 대하여 사전에 인지하고 어떠한 데이터를 넣었을 때 어떠한 결과가 나올지를 예측하는 것이다. 비지도 학습의 경우 목푯값을 사전에 정의하지 않고 데이터 자체만을 가지고 그룹들을 도출함으로써 해석이 용이하지 않지만 새로운 유형의 인사이트를 도출하기에 유용한 방식으로 활용할 수 있다.

 

프로토타이핑 접근법
사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고, 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해보고 그 결과를 확인해 가면서 반복적으로 개선해 나가는 방법
하향식 접근 방식은 문제가 정형화되어 있고 문제를 해결하기 위한 데이터가 완벽하게 조직에 존재할 경우 효과적

이에 반하여 프로토 타이핑 방법론은 비록 완전하지 못하다 해도 신속하게 해결책이나 모형을 제시함으로써, 이를 바탕으로 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화 할 수 있게 하는 유용한 상향식 접근 방식

 

프로토 타이핑 접근법 프로세스

가설의 생성-> 디자인에 대한 실험-> 실제 환경에서의 테스트-> 테스트 결과에서의 통찰 도출 및 가설 확인


프로토타이핑 접근법의 필요성
1) 문제에 대한 인식의 수준: 문제의 정의가 불명확하거나 이전에 접해보지 못한 새로운 문제일 경우, 사용자 및 이해관계자들은 프로토타입을 이용하여 문제를 이해하고, 이를 바탕으로 구체화하는데 도움을 받을 수 있다.
2) 필요 데이터 조재 여부의 불확실성: 문제 해결을 위해 데이터의 집합이 모두 존재하지 않을 경우, 그 데이터의 수집을 어떻게 할 것인지 또는 그 데이터를 다른 데이터로 대체할 것인지 등에 대한 사용자와 분석 간의 반복적인 순환적인 협의과정이 필요하다. 대체 불가능한 데이터가 존재하는지 사전에 확인한다면 불가능한 프로젝트를 수행하는 리스크를 사전에 방지할 수 있다.
3) 데이터 사용 목적의 가변성: 데이터의 가치는 사전에 정해진 수집 목적에 따라 확정되는 것이 아니고 그 가치가 지속적으로 변화할 수 있다. 따라서 조직에서 보유 중인 데이터라 하더라도 기존의 데이터 정의를 재검토하여 데이터 사용목적과 범위를 확대할 수 있을 것이다.

 

분석 과제의 정의
분석 과제 정의서를 통해 분석 별로 필요한 소스 데이터, 분석방법, 데이터 입수 및 분석의 난이도, 분석 수행 주기, 분석 결과에 대한 검증 오너십, 상세 분석과정 등을 정의한다. 분석 데이터 소스는 내외부의 비구조적인 데이터와 소셜미디어 및 오픈 데이터까지 범위를 확장하여 고려하고 분석방법 또한 상세하게 정의한다.

4. 분석 프로젝트 관리 방안

1. 분석 과제 관리의 5가지 주요 영역

과거 형태로 도출된 분석 기회 프로젝트를 통해서 그 가치를 증명하고 목표를 달성해야 한다.
분석 프로젝트는 다른 프로젝트의 유형처럼 범위, 일정, 품질, 리스크 의사소통 등 영역별 관리가 수행되어야 할 뿐만 아니라 다양한 데이터에 기반한 분석기법을 적용하는 특성 때문에 5가지 주요 속성을 고려한 추가적인 관리가 필요하다.

영역 내용
Data Size 분석하고자 하는 데이터의 양을 고려한 관리방안 수립이 필요하다. 하둡환경에서의 엄청난 데이터양을 기반으로 분석하는 것과 기존 정형 데이터베이스에 있는 시간 당 생성되는 데이터를 분석할 의 관리방식은 차이가 날 수 밖에 없다.
Data
Complexity
BI 프로젝트 처럼 정형데이터가 분산 마트로 구성되어 있는 상태에서 분석을 하는 것과 달리, 텍스트, 오디오, 비디오 등의 비정형 데이터 및 다양한 시스템에 산재되어 있는 원천 데이터를 통합해서 분석 프로젝트를 진행할 때는, 초기 데이터의 확보와 통합 뿐 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 산정 등에 대한 사전 고려가 필요
Speed 분석겨로가가 도출되었을 때 이를 활용하는 시나리오 측면에서의 속도를 고려해야 한다. 일단위, 주단위 실적의 경우에는 Batch 형태로 작업되어도 무방하지만 실시간으로 사기를 탐지하거나 고객에게 개인화된 상품, 서비스를 추천하는 경우 분석 모델의 적용 및 계산이 실시간으로 수행되어야 하기 때문에 프로젝트 수행 시 분석 모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야 한다.
Analytic
Complexity
분석 모델의 정확도와 복잡도는 트레이드 오프 관계가 존재한다. 분석 모델이 복잡할 수록 정확도는 올라가지만 해석이 어려워지는 단점이 존재하므로 이에 대한 기준점을 사전에 정의해 두어야 한다. 고객의 신용을 평가하는 마케팅 시나리오에서 분석모델을 활용하여 신용점수가 나올때 어떠한 변수가 기인했는지를 모델에서 설명해 줄 수 없다면 영업 마케팅 직원입장에서는 해당 고객과의 소통이 어려워지는 단점이 존재하므로 해석 가능하면서도 정확도를 올릴수 있는 최적의 모델을 찾는 방안을 모색해야 한다.
Accuray
&
Precison
Accuracy는 모델과 실제 값 사이의 차이가 적다는 정확도를 의미하고, Precision은 모델을 지속적으로 반복했을 때 편차의 수준이 일관적으로 동리한 결과를 제시한다는 것을 의미한다.
분석의 활용적 측면에서는 Accuracy가 중요하며, 안정성 측면에서는 Precision이 중요하다. 그러나 Accuracy와 Precision은 트레이드오프가 되는경우가 많기 때문에 모델의 해석 및 적용시 사전에 고려하여야 한다.

2. 분석 프로젝트의 특성

분석가의 목표

분석의 정확도를 높이는 것이지만 프로젝트의 관점에서는 도출된 분석 과제를 잘 구현하여 원하는 결과를 얻고, 사용자가 원활하게 활용할 수 있도록 전체적이 과정을 고려해야 하기 때문에 개별적인 분석업무 수행뿐만 아니라 전반적인 프로세스 관리가 중요하다.

 

분석가의 입장

데이터의 원천을 다루는 데이터 영역의 결과를 활용한 비즈니스 영역의 중간에서 분석 모델을 통한 조율을 수행하는 조정자 역할이 핵심이 된다. 특히 분석 프로젝트에서는 데이터 영역과 비즈니스 영역의 현황을 이해하고 프로젝트의 목표인 분석의 정확도 달성과 결과에 대한 가치 이해를 전달하는 조정자로서의 분석가의 역할이 중요하다. 조정가로서의 분석가가 해당 프로젝트의 관리자까지 겸임하게 되는 경우가 대부분이므로 프로젝트 관리 방안에 대한 주요 관리 포인트를 사전에 숙지하는 것이 필수적이다.
분석 프로젝트는 도출된 결과의 재해석을 통한 지속적인 반복 및 정교화가 수행되는 경우가 대부분이므로 프로토타이핑 Agile 프로젝트 관리방식에 대한 고려도 필요하다. 데이터 분석의 지속적인 반복 및 개선을 통하여 의도했던 결과가 더욱 가까워지는 형태로 프로젝트가 진행될 수 있도록 적절한 관리 방안 수집이 사전에 필요하다.
분석 프로젝트는 데이터 영역과 비즈니스 영역에 대한 이해뿐만 아니라 지속적인 반복이 요구되는 분석 프로세스 특성을 이해한 프로젝트 관리 방안을 수립하는 것이 중요하다.
분석 과제 정의서를 기반으로 프로젝트를 시작하되 지속적인 개선 및 변경을 염두에 두고 기간 내에 가능한 최선의 결과를 도출할 수 있도록 프로젝트 구성원들과 협업하는 것이 분석 프로젝트의 특징이다

3. 분석 프로젝트의 관리 방안

영역 내용
범위
(Scope)
분석 기획단계의 프로젝트 범위가 분석을 진행하면서 데이터의 형태와 양 또는 적용되는 모델의 알고리즘에따라 범위가 빈번하게 변경된다. 분석의 최종결과물이 분석 보고서 형태인지 시스템에 따라서 투입되는 자원 및 범위 또한 크게 변경되므로 사전에 충분한 고려가 필요하다.
시간
(Time)
데이터 분석 프로젝트는 초기에 의도했던 결과(모델)가 나오기 쉽지 않기 때문에 지속적으로 반복되어 많은 시간이 소요될 수 있다. 분석결과에 대한 품질이 보장된다는 전재로 Time Boxing 기법으로 일정관리를 진행하는 것이 필요하다.
원가
(Cost)
외부 데이터 활용에 대한 데이터 분석인 경우 고가의 비용이 소요될 수 있으므로 사전에 충분한 조사가 필요하다. 오픈 소스 도구이에 프로젝트 수행 시 의도했던 결과를 달성하기 위하여 상용버전도구가 필요할 수 있다.
품질
(Quality)
분석 프로젝트를 수행한 결과에 대한 품질 목푤르 사전에 수립하여 확정해야 한다. 프로젝트 품질은 품질 통제와 품질 보증으로 나누어서 수행되어야 한다.
통합
(Integration)
프로젝트 관리 프로세스들이 통합적으로 운영될 수 있도록 관리해야 한다.
조달
(Procurement)
프로젝트 목적성에 맞는 외부 소싱을 적절하게 운영할 필요가 있다.
PoC 형태의 프로젝트는 인프라 구매가 아닌 클라우드 등 다양한 방안 검토할 필요가 있다.
자원
(Resource)
고급 분석 및 빅데이터 아키텍처링을 수행할 수 있는 인력의 공급이 부족하므로 프로젝트 수행전 전문가 확보에대한 검토가 필요하다.
리스크
(Risk)
분석에 필요한 데이터 미확보로 분석 프로젝트 진행이 어령루 수 있으므로 관련 위험을 식별하고 대응방안을 사전에 수립해야 한다. 데이터 분석 알고리즘의 한계로 품질 목표를 달성하기 어려울 수 있어 그에 따른 대응방안을 수립할 필요가 있다.
의사소통 전문성이 요구되는데이터 분석 결과를 모든 프로젝트 이해 관계자가 공유할 수 있도록 해야한다. 프로젝트의 우너할한 진행을 위한 다양한 의사소통 체계 마련이 필요하다.
이해관계자 데이터 분석 프로젝트는 데이터 전문가, 비즈니스 전문가, 분석 전무가, 시스템 전문가 등 다양한 전문가가 참여하므로 이해관계자의 식별과 관리가 필요하다.
728x90