Machine learning/Basic probability distribution

베타 분포(Beta distribution)

TM 2022. 6. 29. 12:42

베타 분포 

베타분포는 두 매개변수 alpha와 beta에 따라 [0,1] 구간에서 정의되는 연속 확률 분포이다. 말 그대로 alpha와 beta는 베타분포라는 함수의 모양을 결정짓는 파라미터입니다. 직관적으로 이해하기 편하게 베타분포의 확률 밀도 함수를 보면서 설명하겠습니다. 

 

베타분포의 확률밀도함수(PDF)

 

먼저 확률 밀도 함수의 x축은 연속확률변수의 값을 의미하고, y축은 연속확률변수가 갖는 일정 구간의 확률 순간 변화율입니다. 확률 밀도 함수의 모양을 결정짓는 alpha와 beta에 의해서 두 매개변수가 서로 동일한 경우 Uniform한 모양을 가지고 만약 값이 셀수없이 커지면 그래프는 뾰족한 그래프의 형태로 만들어집니다. 또는 alpha와 beta 값이 서로 다를 경우에는 큰 값 쪽으로 그래프가 발산하는 모습을 볼 수 있습니다. 

 

이 확률 분포를 통해서 우리가 찾고자 하는 결과는 어떤 확률변수일때의 확률 값인데 연속확률변수는 셀 수 없는 특징이 있다보니, 연속확률변수들로 이루어지는 확률밀도함수는 어떤 구간을 잡고 확률을 부여합니다. 그렇기 때문에 그 구간에 대한 확률이 곧 넓이로 표현이 되고 그 넓이를 구하기 위해 적분을 이용합니다.

 

말보다는 그림으로 표현하면 아래와 같이 풀 수 있습니다. 확률 밀도 함수에서는 어떠한 구간을 정의했을 때

 

어떤 a..b까지의 구간을 적분을 하게 될 경우 확률 밀도 함수에서 a.. b까지 구간의 확률을 구할 수 있습니다. (확률 밀도 함수에서의 x축은 확률변수 X를 의미하고, y축은 x축 지점에서의 확률의 순간 변화율을 의미합니다.)

 

그러면 다시 본론으로 돌아와서 베타 분포에 대한 PDF를 구성했을 때 연속확률변수 X보다 크거나 작을 확률을 구하는 건데 베타 분포는 아래와 같이 표현할 수 있습니다.

 

 

alpha와 beta는 각각 어떤 시행에 대한 성공과 실패의 횟수로도 정의 할 수 있는데, 0 보다 큰 값을 가지고 있어야 합니다. 베타 분포에 대한 이야기를 하기 전에 확률 밀도 함수에 대한 성질을 생각해보면 

 

그렇다면 예를들어 투창 던지기를 5회 시행했을 때, 4회 성공 1회 실패를 했다면 다음번 창을 던졌을 때 확률변수 X보다 클 확률은?이라는 문제로 접근할 수 있습니다. alpha 4, beta 1에 대한 PDF를 그리면 아래와 같은 확률 밀도 함수를 구할 수 있고,

이때 만약에 확률변수 X가 0.5보다 클 확률은? 그러니까 투창을 5번 던지고 4번 성공 1번 실패를 했을때 다음 투창을 했을 때의 성공률이 50% 이상일 확률은?이라는 문제를 풀 수 있습니다. 수식으로 접근하면 

 

 

다음 투창때 성공률이 50% 이상일 확률은 0.9375 그러니까 93.75% 성공률을 갖는다고 합니다. 

 

지금까지는 베타분포가 어떤 확률밀도함수를 가지고 있고 그 확률밀도함수가 파라미터에 따라 함수의 모양이 결정되는지에 대해 알았습니다. 하지만 조금 더 깊숙히 들어가 그렇다면 베타분포를 왜 사용하는거지? 에 대한 궁금증이 생기는데 이 궁금증은 베이즈 이론에서부터 시작됩니다. 

 

베타분포의 재밌는 특징은 바로 Conjugate prior 라는 점에서 생깁니다. 사실 베이즈 이론의 장점은 확률 모델이 명확하게 잘 만들어져있다면 우리가 찾고 싶은 조건부 확률에 대한 답을 찾을 확률이 높아집니다. 하지만 사전 지식에 대한 모델링은 굉장히 어렵고 또한, 잘못된 사전 지식의 모델링 했을때 사후 확률 결과 값이 크게 달라 질 수 도 있습니다.

 

이때 이 베타 분포를 잘 활용하면 재밌는 결과 값이 나올 수도 있습니다. 알파와 베타 혹은 성공횟수와 실패횟수에 대한 정의를 우리가 이전에 알고 있는 데이터들을 기반으로 잘 정의를 하면 사후 확률을 구할때 사전 확률에 대한 모델이 실시간으로 업데이트되면서 이 Prior는 재귀적으로 계속 사용이 되고 이 행위는 추론(Inference)가 됩니다. 더 나아가 bayesian inference가 되겠지요.

 

지금까지 파라미터에 대한 의미를 어떻게 정의를 하냐에 따라 모양이 달라지는 베타 분포에 대해 알아보았습니다.

 

 

 

 

REFERENCE

 

[연속형 분포] 베타 분포(Beta distribution)

[연속형 분포] 베타 분포(Beta distribution) Published May 11, 2020 <!-- --> 이번 포스트의 주제는 베타 분포(Beta Distribution)입니다. 베타 분포의 의미를 이해하고, 기대값, 분산, 적률생성함수를 구해 보고자

soohee410.github.io