경영정보시각화능력 필기_ 2과목 데이터 해석 및 활용

레벨업/경영정보시각화능력

경영정보시각화능력 필기_ 2과목 데이터 해석 및 활용

우와우앙 2024. 4. 17. 19:30

728x90

01. 경영정보일반

02. 데이터 해석 및 활용

03. 경영정보 시각화 디자인

1) 데이터 개념

[데이터의 정의]

데이터>정보>지식>통찰

[데이터의 역할과 가치]

- 의사결정 지원

- 문제해결

- 미래예측

- 성과관리

- 개인화 서비스

- 추세분석

- 품질 관리

- 위험 관리

- 과학적 연구

- 사회적 통찰

[구조에 따른 데이터 분류]

- 정형데이터

- 반정형데이터 : XML, JSON, HTML, YAML, 로그파일, 소셜미디어데이터, 이메일

- 비정형데이터 : 텍스트 문서, 소셜미디어콘텐츠, 이미지, 오디오, 비디오, 센서 데이터

[특성에 따른 데이터 분류]

- 범주형 데이터

> 명목형 데이터

> 순서형 데이터

- 숫자형 데이터

>이산형 데이터 /정수

>연속형 데이터 /실수

-기타 특성에 따른 데이터 유형

시계열데이터

텍스트데이터

멀티미디어데이터

공간데이터

생성데이터

[데이터 수명 주기]

- 데이터 수집>저장>처리>분석>보관>폐기

[빅데이터 개념]

- 컴퓨터 기술발전, 데이터저장 비용감소, 오픈소스 기술등장, 클라우드컴퓨팅 확산, 인터네과 디지털화, 사무일너텟 증가, 고급분석 및 러신머닝 등장, 데이터 기반의 의사결정, 데이터 과학의 부상으로 출현

- 특징 : 규모, 속도, 다양성, 진정성, 가치

- 기술 : 데이터수집, 데이터 저장, 데이터 처리, 데이터분석, 데이터 시각화, 데이터 보완, 분산컴퓨팅, 도구와 플랫폼, 빅데이터 분석 언어 및 프레임워크

빅데이터활용 : 의사결정, 운영 효율성 향상, 고객이해향상, 혁신 및 제품개발, 리스크 관리, 경쟁우위, 최적화된 마케팅 및 광고, 실기간 통찰

02. 데이터 해석

[데이터 해석의 주요관점]

- 통계적 관점

- 비즈니스 관점

- 맥락적 관점

- 데이터 품질관점

-윤리적관점

- 시각적관점

- 기술적 관점

[데이터 해석 관점의 중요성]

- 정확한 이사결정

- 전략적 통찰

-문제해결

-혁신촉진

-사회적영향

[데이터 해석 오류]

- 표본 편향/모집단 대표하지 못할 때 발생

- 측정오류

- 거짓 인과관계

- 이상치 무시

-일반화 오류 / 확증평향, 과대적합, 과소적합, 단일 변수 오류, 심슨의 역설

- 적절하지 않은 모델 선텍

-통계적 허위성

[데이터 탐색] EDA

- 주어진 데이터 세트를 다양한 각도에서 분석하고 이해하는 과정

데이터 탐색역할

데이터 탐색의 주요단계

[기초통계]

- 통계 정의 : 데이터를 수집, 분석, 결과해석, 요약, 불확실성 처리

- 기술통계 :

중심경향성 : 평균, 중앙값, 최빈

분산, 변동성 : 범위, 사분위수, 분산 표춘편

- 추론통계 : 표본데이터를 사용해서 전체 모집단 결론 도출

모집단>표본>표본추출>모수추청>신뢰구간>가설검정>상관관계>회귀분석

[확률]

- 불확실성한 사건의 발생가능성을 수학적으로 표현하는 방법

(정의)

확률 : 특정 사건이 발생할 가능성을 수치로 나태난 것으로 0~1사이 값.

사건 : 확률에서 고려되는 일련의 결과

표본공간 : 가능한 모든 결과 집합

(종류)

고전적 확률

빈도주의확률

베이지안 확률 : 사건의 발생가능성을 주관적인 믿음이나 추정에 근거하여 정의

[확률분포]

-확률변수

- 확률 질량 함수 pmf

- 확률 밀도 함수 pdf

[이산 확률 분포]

이항분포 : 성공/실패 두가지 결과만을 가지는 독립적인 베르누이 시행을 일정횟수 반복했을 떄 확률분포/ 동전 던지기

포아송분포 : 일정 시간, 공간에서 발생하는 사건의 평균 발생률 . 도착패턴, 고객 서비스 요청 등

[연속 확률 분포]

정규분포, 연속 균일 분포, 지수분포, 카이제곱분포, 스튜던트 t분포

[데이터마이닝]

분석기술 : 연관분석(데이터 집합에서 항목간의 인과성 찾는 기법) 지지도, 신뢰도, 향상도 측정

군집분석 : 데이터 유사한 집단으로 그룹화하여 성격파악하는 기법

분류분석 : 데이터 포인트를 미리 정의된 클래스 또는 범주로 할당하는 작업

회귀예측 : 연속형 변수값을 예측하는 기법

차원축소 : 주성분분석PCA, t-SNE 등

이상탐지

텍스트 마이닝

신경망 및 딥러

728x90

저작자표시 비영리 (새창열림)