Machine learning/Basic probability distribution

확률 분포의 의미와 종류

TM 2022. 1. 31. 15:03
확률분포(probability distribution)는 어떠한 확률변수(예를 들어, X)가 특정한 값을 가질 확률을 나타내는 함수를 의미합니다.
이산 확률분포: 베르누이, 이항, 기하, 음이항, 푸아송, 초기하, 라학
연속 확률분포: 균등, 정규, 표준 정규, 가수, t, 카이제곱, f, 감마, 웨이블, 베타

 

이산 확률분포(discrete probability distribution)는 확률변수의 개수를 셀 수 있는 경우를 의미합니다. 예를 들어, 주사위를 던져서 나오는 눈의 개수는 1,2,3,4,5,6 여섯 가지 이므로 확률변수 X는 여섯 가지의 경우를 가질 수 있습니다. 이러한 경우 정수의 값을 가지는 확률변수가 가질 수 있는 값은 6개로 카운팅 할 수 있기 때문에 이산 확률변수에 해당합니다. (하지만, 이산 확률분포는 확률변수의 개수에 제약이 없습니다. 대표적인 예로 자연수는 무한하지만 이산 확률변수에 속합니다. 왜냐하면 순서대로 셀 수 있기 때문입니다.)

 

연속 확률분포(continuous probability distribution)는 이산 확률분포와는 반대로 확률변수가 가질 수 있는 값의 개수를 셀 수 없다는 의미입니다. 예를 들어, 연속 확률변수인 확률변수 X를 대학교 1학년 학생들의 평균 키라고 했을 때, 평균 키는 실수 값을 가지며 이는 셀 수 있는 정수가 아닌 무수히 연속해서 연결되어 있는 실수 값을 갖는 경우에 해당합니다. 따라서 이런 경우 확률 변수 X는 연속 확률변수에 해당한다고 할 수 있습니다.

위 그림처럼 이산 확률분포는 동전의 앞면과 뒷면, 주사위의 눈 등과 같이 셀 수 있는 확률변수를 가지는 분포를 의미하고, 연속 확률분포는 온도, 시간 등과 같이 셀 수 없는 확률변수를 가지는 분포를 의미합니다.