실험을 통한 의사결정

Data Analyst/데이터 활용

실험을 통한 의사결정

e_mily.dy 2023. 9. 15. 20:04

728x90

모수와 표본

1) 모집단 정의 → 2) 표본 정의 → 3) 표본을 구하는 방법을 고민 → 4) 데이터 수집

1) 전체 사용자의 구매 패턴

2) 2020년 12월 한 달 간 구매 사용자에 대한 구매 데이터

큰 수의 법칙 ‘표본의 크기가 충분히 크다면 표본평균은 모평균에 충분히 가까워진다’
모수 값을 근거로 모집단의 형태를 추정 (모집단의 수치적 요약값, 통계값 )
중심 극한 정리 로도 모집단의 형태를 추정
‘동일한 확률분포를 가진 독립 변수 확률 n개의 평균의 분포는 n이 적당히 크면 정규분포에 가까워 진다’

확률과 분포

확률: 시행 결과값의 평균을 0 ~ 1 사이로 나타낸 것
분포: 확률이 어떤 모습으로 퍼져 있는지를 나타낸 것

데이터가 없는 상태에서 확률을 구하고 싶을 때, 실험을 통해 데이터를 얻는다
확률은 미래를 보장하지는 않는다. 언제나 확률 분포의 평균값을 얻을 수는 없지만, 큰 수의 법칙에 따라 시간이 지날수록 확률의 평균값에 가까워질 수는 있다
실험 기간의 데이터를 그대로 사용한 데이터 분석 결과는 다소 신뢰도가 낮아질 수 밖에 없다
- 설계된 환경 속에서 실험한 결과 데이터는 다른 분석에 쓰일 수 없다는 것으로 이해했다

A/B Testing

Treatement Group / Control Group
실험을 통해 데이터를 수집하고 의사결정을 한다
사전에 두 집단의 ‘통계적 유의성’을 미리 파악해 유의하다고 판단되는 선에서 실험을 진행해야 한다
통계적 유의성
- t-검정, f-검정 등 두 집단의 평균/분산이 차이가 있을 것이다 ~ 등
실험 도중에 다른 변수가 생기면, 중단하거나 재설계 하는 등 조치를 취한다

저작자표시 (새창열림)

'Data Analyst > 데이터 활용' 카테고리의 다른 글

직관과 분석에 대한 이야기 (0)	2023.09.19
별 다섯 개, 평점의 함정 (0)	2023.09.17
로그 데이터를 활용한 Funnel 분석 (0)	2023.09.16
효과적인 데이터 시각화를 위한 9 Tips (0)	2023.09.14
데이터 문해력, 목적 중심 사고 (0)	2023.09.09

현재글실험을 통한 의사결정

서울 워킹 홀리데이

station, HackerRank_SQL, 분석가로일하면어려운점, 서브쿼리 (SubQuery), 해커랭크, 하비스트버스, 분석필요역량, 분석에요구되는역량, 금융감독원교육, Subquery, 술탄아흐메트에서 공항버스, 데이터분석가, 리텐션떨어지는이유, 서브쿼리, SQLD, HackerRank, Hackerrank-SQL, 술만아흐메트, 주니어데이터분석가, 데이터시각화,

Today :
Yesterday :

티스토리툴바