작성자: admin 작성일시: 2016-10-01 22:33:21 조회수: 93 다운로드: 19
카테고리: 기초 수학 태그목록:

카이 제곱 분포

가우시안 정규 분포를 따르는 확률 변수 $X$ 의 $n$개의 샘플 $x_1, \cdots, x_n$의 합(또는 평균)은 student-t 분포를 따른다.

만약 이 샘플들을 단순히 더하는 것이 아니라 제곱을 하여 더하면 양수값만을 가지는 분포가 된다. 이 분포를 카이 제곱(chi-squared) 분포라고 하며 $\chi^2(x;\nu)$ 와 같이 표기한다. 카이 제곱 분포도 student-t 분포처럼 자유도(degree of freedom) 모수를 가진다.

$$ x_i \sim \mathcal{N} $$$$ \downarrow $$$$ \sum_{i=1}^n x_i^2 \sim \chi^2(n) $$

카이 제곱 분포의 확률 밀도 함수는 다음과 같다.

$$ f(x) = \frac{x^{(\nu/2-1)} e^{-x/2}}{2^{\nu/2} \Gamma\left(\frac{\nu}{2}\right)} $$

dchisq 명령어를 사용하여 확률 밀도 함수의 모양을 살펴보면 다음과 같다.

In [9]:
library(RColorBrewer)
cols <- brewer.pal(n=5, name="Set1")
xx <- seq(0, 25, length=200)
i <- 1
dfs <- c(1, 2, 5, 10, 20)
for (df in dfs) {
    plot(xx, dchisq(xx, df=df), type="l", xlab="", ylab="", main="",
         xlim=c(0, 25), ylim=c(0, 0.4), col=cols[i])
    par(new=TRUE)
    i <- i + 1
}
legend("topleft", legend=paste("df = ", dfs), col=cols, lty=1)

질문/덧글

아직 질문이나 덧글이 없습니다. 첫번째 글을 남겨주세요!