2개의 군집에서 표본을 비복원 추출했을 때, 어떤군에 속한 표본의 수

n: 추출 원소 개수, D : 관심그룹의 원소 개수, N : 전체 원소 개수

 

확률변수 표기 : X~Hyp(n, D, N) 

기대값 : E(x) = nD/N

분산 : Var(x)=n*(D/N)*((N-D)/N)*((N-n)/(N-1))

 

문제 1: 상자속에 빨간공이 5개, 파란공이 3개일때 공3개를 뽑았을때 빨간공 2개, 파란공 1개가 뽑힐 확률은?

from scipy.stats import hypergeom

hypergeom.pmf(2,9,5,3)
# 0.476105

# hypergeom.pmf(x, N, r, n)
# x : 확인하고자 하는 사건 빨간공 2개뽑을 확률
# N : 전체 요소수 : 10개공
# r : 성공 요소의 수 : 빨간공 5개
# n : 시행횟수 3

 

문제 2: 주머니에 48개의 공이 들어있다. 이중 12개가 빨간색 공일 때 8개 공을 뽑았을 때 빨간공이 2개 이상일 확률은?

1-hypergeom.cdf(1, 48,12,8)
# 1(전체) - 0과 1일 누적 확률을 빼준다.

0.6543451762852719

 

문제3 : 전체 23명중 여성이 8명일때, 임의로 8명을 뽑았을때 여성이 3명 이상일 확률은?

1-hypergeom.cdf(2,23,8,8)
0.59606497061067

'통계' 카테고리의 다른 글

선형 회귀 분석 - Linear regression model python  (0) 2023.07.06
지수 분포(Exponential Distribution)  (0) 2023.07.04
확률분포(Distribution)  (0) 2023.06.18
이상치 처리  (0) 2023.06.17
신뢰구간(Confidnce Interval) 파이썬  (0) 2023.06.10

+ Recent posts