ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [빅데이터분석기사/필기] 1-2-2. 분석 작업 계획
    program_language 및 궁금한것/빅데이터 분석 기사 2021. 9. 18. 01:37

    01. 분석 작업 개요

    1) 데이터 처리 영역

    - 데이터 분석을 위한 기초 데이터를 정의 하고 수집 및 저장, 분석하기 수월하도록 물리적인 환경을 제공하는 영역

    - 데이터 소스, 수집, 저장, 처리

    2) 데이터 분석 영역

    - 저장되어 있는 데이터를 추출하여 분석 목적과 방법에 맞게 가공한 후 데이터 분석을 직접 수행하고 그 결과를 표현하는 영역

    (1) 데이터 분석 - NCS(국가직무능력표준)

    - 도메인 이슈 도출

    - 분석목표 수립

    - 프로젝트 계획 수립

    - 보유 데이터 자산 확인

     

    02. 데이터 확보 계획

    1) 데이터 확보를 위한 사전 검토사항

    (1) 필요 데이터의 정의

    (2) 보유 데이터의 현황파악

    (3) 분석 데이터의 유형

    (4) 편향되지 않고 충분한 양의 데이터 규모

    - 훈련 데이터셋(Training)

    - 검증 데이터 셋(Validation)

    - 테스트 데이터셋(Test)

    (5) 내부 데이터의 사용

    (6) 외부 데이터의 수집

     

    2) 분석에 필요한 변수 정의

    - 활용 시나리오에 적합한 데이터의 유형 및 분석 변수를 정의

    (1) 데이터 수집 기획

    (2) 분석 변수 정의

     

    3) 분석 변수 생성 프로제스 정의

    - 분석 대상에 대해 객관적으로 인식

    (1) 객관적 사실 기반의 문제 접근

    (2) 데이터 상관 분석

    (3) 프로토타입을 통한 분석 변수 접근

     

    4) 생성된 분석 변수의 정제를 위한 점검항목 정의

    - 데이터에 대해 가용성을 평가하고 점검항목을 정의

    (1) 분석 변수 점검항목 정의

    분류 점검 항목
    데이터 수집 데이터 적정성
    데이터 가용성
    대체 분석 데이터 유무
    데이터 적합성 데이터 중복
    분석 변수별 범위
    분석 변수별 연관성
    데이터 내구성
    특징 변수 특징 변수 사용
    변수 간 결합 가능 여부
    타당성 편익/비용 검증
    기술적 타당성

     

    5) 생성된 분석 변수의 전처리 방법 수립

    - 논리적 모형 설계를 위한 데이터 전처리 방법을 수립

    (1) 데이터 전처리 수행

    - 데이터 정제

    - 데이터 통합

    - 데이터 축소

    - 데이터 변환

    (2) 빅데이터 분석 프로세스 수행

     

    6) 생성 변수의 검증 방안 수립

    (1) 분석 변수의 데이터 검증 방안 수립

    * 빅데이터의 주요 품질 지표

    - 정확성

    - 완전성

    - 적시성

    - 일관성

     

    03. 분석 절차와 작업 계획

    1) 분석 절차

    (1) 일반적인 분석 절차

    문제인식 -> 연구조사 -> 모형화 -> 데이터 수집 -> 데이터 분석 -> 분석 결과 제시

     

    2) 작업 계획

    (1) 분석 작업 계획 수립 절차

    - 프로젝트 소요비용 배분

    - 프로젝트 작업분할구조 수립

    - 프로젝트 업무 분장 계획 및 배분

    (2) 분석 작업 계획 수립을 위한 작업분할 구조(WBS)

    - 데이터 분석과제 정의

    - 데이터 준비 및 탐색

    - 데이터 분석 모델링 및 검증

    - 산출물 정리

     

    3) 분석목표정의서

    (1) 구성요소

    - 원천 데이터 조사

    - 분석 방안 및 적용 가능성 판단

    - 성과평가

     

    04. 분석 프로젝트 관리

    1) 분석 프로젝트 관리영역

    - 데이터 크기

    - 데이터 복잡도

    - 속도

    - 분석 모형의 복잡도

    - 정확도(Accuracy)와 정밀도(Precision)

     

    3) 분석 프로젝트의 영역별 주요 관리 항목

    (1) 범위 관리

    (2) 일정 관리

    (3) 원가 관리

    (4) 품질 관리

    (5) 통합 관리

    (6) 조달 관리

    (7) 인적자원 관리

    (8) 위험 관리

    (9) 의사소통 관리

    (10) 이해 관계자 관리

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    반응형

    댓글

Designed by Tistory.