작성자: admin 작성일시: 2016-09-22 21:01:53 조회수: 472 다운로드: 30
카테고리: R 태그목록:

R을 이용한 확률 분포 분석

여기에서는 R의 확률 분포 분석을 위한 기능에 대해 설명한다.

확률 분포 명령

R의 확률 분포 명령의 이름은 기능 접두사 + 확률 분포 이름의 형태로 만들어졌다.

여기에서 기능 접두사는 d, p, q, r 이 있으며 각 접두사의 의미는 다음과 같다.

접두사 의미
d 확률 밀도(질량) 함수 (probability density/mass function)
p 누적 분포 함수 (cumulative distribution function)
q 분위수 계산 함수 (quantile function)
r 랜덤 샘플 생성 (sample realization)

확률 분포 이름은 다음과 같다.

종류 이름 확률 분포
이산 bern 베르누이 분포
이산 binom 균일 분포
연속 unif 베르누이 분포
연속 norm 가우시안 정규 분포
연속 beta 베타 분포
연속 gamma 감마 분포
연속 t 스튜던트 t 분포
연속 chisq 카이 제곱 분포
연속 f F 분포
연속 dirichlet 디리클리 분포
연속 mvnorm 다변수 가우시안 정규 분포 (mvtnorm 패키지)

다음의 접미사와 확률 분포 이름을 조합하는 예이다.

  • dbern : 베르누이 분포의 확률 질량 함수
  • dnorm : 가우시안 정규 분포의 확률 밀도 함수
  • pt : 스튜던트 t 분포의 누적 분포 함수
  • qf : F 분포의 분위수 함수
  • rbeta : 베타 분포의 샘플 생성 함수

명령어를 실행시킬 때는 해당 확률 분포에 해당하는 모수(parameter) 혹은 인수들 지정해 주어야 한다.

다음은 이 명령어들을 사용하는 예이다.

확률 질량 함수

In [19]:
x <- seq(0,10,1)
m <- dbinom(x, 10, prob=0.2)
plot(x, m, type='p', pch=1, col=1, ylim=c(0, max(m)), ylab="", main="Probability Mass Function")
lines(x, m, type='h', col=1)

확률 밀도 함수

In [12]:
x <- seq(-4,4,0.1)
d <- dnorm(x, 0, 1)
plot(x, d, type='l', ylim=c(0, max(d)), ylab="", main="Probability Density Function")

누적 분포 함수

In [13]:
x <- seq(-4,4,0.1)
d <- pnorm(x, 0, 1)
plot(x, d, type='l', ylim=c(0, max(d)), ylab="", main="Cumulative Distribution Function")

샘플 생성 함수

In [17]:
x <- rnorm(1000, 0, 1)
hist(x)

질문/덧글

아직 질문이나 덧글이 없습니다. 첫번째 글을 남겨주세요!