큰 수의 법칙
앙상블에 대해 공부하다가 "큰 수의 법칙" 이라는 개념이 나왔는데 이해가 되지 않아, 뤼튼에 물어보았다.
내 질문:
"동전을 던졌을 때, 앞면이 51%, 뒷면이 49% 나오는 조금 균형이 맞지 않는 동전이 있다고 가정하겠습니다. 이 동전을 1000번 던진다면 대략 510번은 앞면, 490번은 뒷면이 나올 것이므로 다수는 앞면이 됩니다. 수학적으로 계산해보면 1000번을 던진 후 앞면이 다수가 될 확률은 75%에 가깝다는 것을 확인할 수 있습니다." 라는 말이 이해가 안가요. 1000번 던져서 510번 앞면이 나온다면 앞면이 다수가 될 확률은 51%아닌가요?
답변:
아니요, 그렇지 않습니다. 1000번 던져서 510번 앞면이 나오는 것은 51%의 확률이 맞습니다. 그러나 앞면이 다수가 될 확률은 75%에 가깝습니다.
이유는 다음과 같습니다:
- 51%의 앞면 확률은 개별 실험에 대한 것입니다.
- 1000번 던져서 510번 앞면이 나오는 것은 각 실험의 평균적인 결과입니다.
- 그러나 1000번 실험 중에서 앞면이 다수가 되는 경우, 즉 앞면이 500번 이상 나오는 경우의 확률은 약 75%에 가깝습니다.
내 질문: 75%가 어떻게 나온것인지 알려주세요.
답변:
네, 1000번 동전을 던져서 앞면이 다수가 될 확률이 75%에 가깝다는 것을 수학적으로 계산해보겠습니다.
동전의 앞면 확률이 51%, 뒷면 확률이 49%라고 했을 때, 1000번 동전을 던져서 앞면이 500번 이상 나올 확률을 구하면 됩니다.
이를 계산하기 위해 이항분포(Binomial distribution)를 사용할 수 있습니다.
이항분포 공식: P(X = k) = (n!/[k!(n-k)!]) * p^k * (1-p)^(n-k)
여기서,
- n = 실험 횟수 (1000번)
- k = 관심 사건 발생 횟수 (앞면이 500번 이상)
- p = 앞면 확률 (0.51)
계산 과정: P(앞면 ≥ 500) = P(X ≥ 500) = P(X = 500) + P(X = 501) + ... + P(X = 1000) = 약 0.75 (75%)
따라서 1000번 동전을 던져서 앞면이 다수가 될 확률은 약 75%라고 할 수 있습니다.
이처럼 개별 실험의 확률과 전체 실험 결과의 확률이 다를 수 있음을 보여주는 예시입니다.
내 질문: 왜 이 계산을 할 때, 이항분포를 사용하나요? 이항분포가 무엇이며 언제 사용하는지 설명해주세요.
답변:
좋습니다. 이항분포(Binomial Distribution)는 이산확률분포의 한 종류로, 다음과 같은 특징이 있습니다:
- 시행 횟수가 고정되어 있을 때(n번)
- 각 시행의 결과가 두 가지 경우(성공/실패, 앞면/뒷면 등)로 구분될 때
- 각 시행의 결과가 서로 독립적이며
- 성공 확률이 모든 시행에서 동일할 때
이러한 조건을 만족하는 확률 실험에서 이항분포를 사용할 수 있습니다.
동전 던지기 실험은 전형적인 이항분포 모델에 해당합니다. 1000번 동전을 던지는 것은 n=1000번의 시행이 되고, 각 시행의 결과는 앞면(성공) 또는 뒷면(실패)으로 구분됩니다. 또한 각 시행은 독립적이며, 앞면이 나올 확률(p=0.51)은 모든 시행에서 동일합니다.
따라서 이 문제에서 1000번 동전 던지기 실험의 결과를 분석할 때, 이항분포 공식을 사용하는 것이 적절합니다. 이를 통해 앞면이 500번 이상 나올 확률과 같은 복잡한 확률 계산을 수행할 수 있습니다.
이항분포는 품질관리, A/B 테스트, 의학 실험 등 다양한 분야에서 활용됩니다. 이산적인 결과를 가지는 확률 실험에 적합한 통계 모델이라고 할 수 있습니다.
내 질문:
근데 다수라고 하면 501번 이상이 되어야하는거 아닌가요? 앞면 500번, 뒷면 500번이 나왔을 때, 앞면이 나온 경우가 뒷면이 나온 경우에 비해 다수라고 할 수 없는 것 아닌가요?
답변:
네, 말씀하신 것처럼 좀 더 엄밀하게 생각해보면 다수라는 기준은 501번 이상이 되어야 합니다.
앞면 500번, 뒷면 500번이 나온 경우에는 엄밀히 말해 앞면이 다수라고 할 수 없습니다. 이 경우는 오히려 동수라고 봐야 할 것 같습니다.
따라서 이 문제에서 다수를 판단하는 기준은 앞면이 501번 이상이 되어야 한다고 볼 수 있습니다.
이를 반영하여 다시 계산하면 다음과 같습니다:
P(앞면 ≥ 501) = P(X ≥ 501) = P(X = 501) + P(X = 502) + ... + P(X = 1000) = 약 0.7326 (73.26%)
즉, 1000번 동전을 던져서 앞면이 501번 이상 나올 확률은 약 73.26%라고 할 수 있습니다.
이러한 원리로 동전을 10,000번 던지면 확률이 97%이상 올라간다고 한다.
큰 수의 법칙이 이해가 되었다 ^_^