2개의 군집에서 표본을 비복원 추출했을 때, 어떤군에 속한 표본의 수
n: 추출 원소 개수, D : 관심그룹의 원소 개수, N : 전체 원소 개수
확률변수 표기 : X~Hyp(n, D, N)
기대값 : E(x) = nD/N
분산 : Var(x)=n*(D/N)*((N-D)/N)*((N-n)/(N-1))
문제 1: 상자속에 빨간공이 5개, 파란공이 3개일때 공3개를 뽑았을때 빨간공 2개, 파란공 1개가 뽑힐 확률은?
from scipy.stats import hypergeom
hypergeom.pmf(2,9,5,3)
# 0.476105
# hypergeom.pmf(x, N, r, n)
# x : 확인하고자 하는 사건 빨간공 2개뽑을 확률
# N : 전체 요소수 : 10개공
# r : 성공 요소의 수 : 빨간공 5개
# n : 시행횟수 3
문제 2: 주머니에 48개의 공이 들어있다. 이중 12개가 빨간색 공일 때 8개 공을 뽑았을 때 빨간공이 2개 이상일 확률은?
1-hypergeom.cdf(1, 48,12,8)
# 1(전체) - 0과 1일 누적 확률을 빼준다.
0.6543451762852719
문제3 : 전체 23명중 여성이 8명일때, 임의로 8명을 뽑았을때 여성이 3명 이상일 확률은?
1-hypergeom.cdf(2,23,8,8)
0.59606497061067
'통계' 카테고리의 다른 글
선형 회귀 분석 - Linear regression model python (0) | 2023.07.06 |
---|---|
지수 분포(Exponential Distribution) (0) | 2023.07.04 |
확률분포(Distribution) (0) | 2023.06.18 |
이상치 처리 (0) | 2023.06.17 |
신뢰구간(Confidnce Interval) 파이썬 (0) | 2023.06.10 |