중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

큰 수의 법칙(Low of Large Number)과 중심 극한 정리(Central Limit Theorem)는 통계에서 가장 중요한 정리 중 하나이다.

하지만, 정확히 이해하지 못하면 큰 오류를 범할 수 있는 법칙이기도 하다.

사건을 무한히 반복할 때 일정한 사건이 일어나는 비율은 횟수를 거듭하면 할수록 일정한 값에 가까워지는 법칙을 말한다.

여기서 샘플링하는 것은 복원 추출을 기반으로 하며 각 사건은 동일하다.

어떤 시행에서 사건 A가 일어날 수학적 확률이 p이고 n 번의 독립시행에서 사건 A가 r 번 일어난다고 할 때 임의의 엡실론 > 0에 대하여 다음과 같다.

r/n은 p에 수렴하여 (r/n - p)는 0이 되기 때문에

어떤 0보다 큰 임의의 수 엡실론이 와도 probability는 1(100%)이라는 의미이다.

예를 들어 동전을 100번 던져서 앞면이 60번 나왔다면 이때 앞면이 나올 확률은 0.6이지만, n을 무한히 늘리는 즉 동전을 무한히 던지면 앞면이 나올 확률은 결국 0.5에 근사할 것이다.

이것은 어떤 모집단에서 표본들을 추출할 때, 각 표본의 크기가 커지면(시행 횟수가 늘어나면) 상대도수와 모비율의 값이 같아질 확률이 높아진다는 의미로 이해가 가능하다.

모집단의 분포에 상관없이 임의의 분포에서 추출된 표본들의 평균의 분포는 정규분포를 이룬다는 법칙을 말한다.

단, 표본의 크기는 최소 30 이상이 돼야 한다.

서로 독립이며 동일한 분포를 따르는 확률변수 X_1, ..., X_n에 대해, 각각의 평균은 E(X_i)=μ이고 각각의 표준편차가 시그마일 때 다음 분포는 정규분포로 분포수렴한다.

이 이론을 따르게 어떤 분포이든 표본만 충분하다면 정규분포와 관련된 수학적 이론들을 적용할 수 있게 된다.

중심 극한 정리로 인해 다음 두 가지가 가능해진다.

1. 샘플 수가 30개 이상이라면 모집단의 평균과 분산을 알아낼 수 있다.

2. 모든 샘플들은 정규분포로 나타낼 수 있으며, 정규분포와 관련된 수학적 이론들을 적용할 수 있게 된다.

Research/Science & Mathmatics

큰 수의 법칙, 중심 극한의 정리

by IMCOMKING 2014. 6. 11.

# 큰 수의 법칙 : 표본집단들의 평균과 분산에 대한 법칙
어떤 모집단에서 표본집단들을 추출할 때, 각 표본집단의 크기가 커지면 그 표본집단들의 평균은 모집단의 평균과 같아지고, 표본집단들의 분산은 0에 가까워 진다.

http://dermabae.tistory.com/146

http://blog.daum.net/gongdjn/114

# 중심극한의 정리(Central limit theorem) : 표본집단들의 평균이 갖는 분포에 대한 법칙
그 어떠한 모양의 임의의 분포에서 추출한 표본집단들의 평균(표본평균)의 분포는 정규분포를 이룬다.
(심지어 모집단이 정규분포를 따르지 않더라도. 단 각각의 표본의 크기가 적당히 커야한다. 30이상)

http://blog.naver.com/PostView.nhn?blogId=afterglow25&logNo=110088875140
http://support.minitab.com/ko-kr/minitab/17/topic-library/basic-statistics-and-graphs/introductory-concepts/basic-concepts/central-limit-theorem/


정규분포를 따르게되면 우리는 통계적으로 아주 강력한 이론들을 많이 적용할 수 있다. 

즉 중심 극한의 정리를 이용해 모집단이 정규분포를 따르지 않더라도, 충분히 큰(30개 이상) 표본을 추출하면 정규분포를 따르기 때문에 이를 정규분포로 분석할 수 있게된다.

💡 큰수의 법칙 (Law of large numbers)

  • 큰 수의 법칙이란 어떤 모집단에서 표본 집단들을 추출할 때, 추출한 데이터의 크기가 커질수록
    표본 집단들의 평균은 모평균과 같아지고, 표본 집단들의 분산은 0에 가까워진다는 것이다.

💡 중심극한정리 (Central Limit Theorem)

  • 중심극한정리는 표본의 수가 충분히 많으면, 모집단의 분포 형태와 상관없이 표본평균의 분포가 정규 분포에 가까워진다는 것이다.

큰수의 법칙, 중심극한의정리 모두 표본집단의 크기가 커짐에 따라 발생하는 현상이다.

그러나 '큰수의 법칙'은 표본 크기가 무한히 커짐에 따라 표본평균이 모평균으로 "확률수렴"을 한다는 개념이고, '중심극한정리'는 표본 크기가 무한히 커짐에 따라 표준화한 표본평균의 분포가 표준정규분포로 "분포수렴"하는 개념이다.
즉, 대수의 법칙은 확률수렴 측면이고, 중심극한정리는 분포수렴 측면의 개념이다.

# 천천히 읽어보고 이해하기

확률수렴
Xn이 무한대로 증가함에 따라,
Xn과 X 차이의 절대값에 대한 확률의 극한값이 0이면 Xn이 X로 확률수렴한다고 함.


분포수렴
확률변수 X가, 극한분포가 연속인 모든 점에 대해서,
누적분포함수 Fxn의 극한값이 누적분포함수 Fx와 같다면 Xn이 X로 분포수렴한다고 함.

개념 블로그


💡 신뢰구간

  • 모수가 있을 것으로 예상되는 범위이다.

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

신뢰도를 95%라고 가정한다면, 신뢰구간은 아래 그림처럼 표현할 수 있다. 표본을 뽑아 평균을 내는 것을 100번 한다면 95번은 녹색 선의 범위 내에 나타낼 수 있다는 것이다.(신뢰구간)

t•sns\over \sqrt n 는 error, x bar는 추정 평균이다.

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

반응형

큰 수의 법칙 vs 중심극한의 정리

> 표본의 크기를 크게 하냐?!  --> 큰 수의 법칙

> 표본의 갯수를 많이 뽑냐?!  --> 중심 극한의 정리

큰 수의 법칙 (Law of Large Numbers)

- 표본집단들의 평균과 분산에 대한 법칙
- 어떤 모집단에서 표본집단들을 추출할 때, 각 표본집단의 크기가 커지면 그 표본집단들의 평균은 모집단의 평균과 같아지고, 표본집단들의 분산은 0에 가까워 진다.

>> 한번 측정해서 평균을 구한 결과보다 여러번 시행해서 낸 평균값이 더 정확하다.

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

중심극한의 정리(Central limit theorem)

- 표본집단들의 평균이 갖는 분포에 대한 법칙
- 그 어떠한 모양의 임의의 분포에서 추출한 표본집단들의 평균(표본평균)의 분포는 정규분포를 이룬다.
(심지어 모집단이 정규분포를 따르지 않더라도. 단 각각의 표본의 크기가 적당히 커야한다. 30이상)

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig
중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

- 표본이 충분이 크다면(n>30), 표본들의 평균은 정규분포를 따른다.

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

- 중심극한의 정리가 중요한 이유

   > 모집단의 분포에 상관없이, 모집단으로 부터 크기가 큰 표본들을 추출했을때, 그것이 정규분포를 따르기 때문에 통계적인 판단을 할 수 있음

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

http://blog.daum.net/gongdjn/114

[11-4] 큰수의 법칙과 중심극한정리

※ 자료 출처 : Mathematical statistics with applications (K.M. Ramachandran, C. P. Tsokos 저) 앞에서 배웠던 체비세프의 정리, 큰수의 법칙, 중심극한 정리를 예를 들어 비교해보자. 1. 체비세프의 정리..

blog.daum.net

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

http://dermabae.tistory.com/146

중심극한정리

많은 통계모형들은 자료가 정규분포라는 가정에 기초하여 발달되었다. 그러므로 어떤 표본이 정규분포라는 가정을 할 수 있다면 다양한 분석법을 사용할 수 있어 통계적으로 매우 유리하다. 앞

dermabae.tistory.com

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

drhongdatanote.tistory.com/57

[개념 통계] 중심극한 정리는 무엇이고 왜 중요한가?

안녕하세요. 홍박사입니다. 정말 오랜만에 포스팅을 합니다. 바쁘다는 핑계로 계속 포스팅을 미뤄오다가 마음을 다잡고 짧은 호흡으로라도 포스팅을 하는 것이 좋을 것 같다는 생각이 들었습니

drhongdatanote.tistory.com

중심 극한 정리 큰수의 법칙 - jungsim geughan jeongli keunsuui beobchig

728x90

반응형

'Statistical Learning' 카테고리의 다른 글

[기초통계] 공분산과 상관계수 (covarience, correlation)  (0) 2020.12.07
[기초 통계] Q-Q Plot (feat. shapiro-test)  (0) 2020.11.28
Outliers & leverage  (0) 2020.11.06
[기초통계] 1종 오류와 2종 오류  (0) 2020.11.05
다중 회귀 분석 vs 다항 회귀 분석 (Multiple VS Polynomial regression analysis)  (0) 2020.11.04