Kwangmin Kim - 연속 분포 — 정규, 감마, 베타, 코시, 로그정규 이론과 실무

1 왜 연속 분포인가

이산 분포가 셀 수 있는 결과를 모델링한다면, 연속 분포는 측정값·길이·시간·비율처럼 실수 직선(또는 그 일부) 위에 놓이는 현상을 모델링한다. 연속 분포에서 확률은 밀도 함수(PDF)의 적분으로 주어진다:

\[ P(a \le X \le b) = \int_a^b f_X(x) \, dx \]

직관: 왜 확률이 적분인가

이산 분포에서는 각 값의 확률을 더한다. 연속 분포에서는 단일 점의 확률이 0이므로(구간의 길이가 0이기 때문), “더한다”는 개념이 적분으로 바뀐다.

\(f_X(x)\) 를 “밀도”라고 부르는 이유가 여기 있다 — 밀도는 얼마나 확률이 그 근방에 밀집해 있는지를 나타낸다. 아주 좁은 구간 \([x, x+dx]\) 의 확률은 \(f_X(x) \cdot dx\) 로 근사된다. 이 작은 직사각형들을 모두 더하면(적분하면) 전체 확률이 된다.

반사실: 만약 모든 점에 양수 확률을 부여하면 비가산 무한 개의 양수를 더해야 하므로 합이 무한대가 된다. 따라서 연속 분포에서는 개별 점 대신 구간에 대한 확률만 의미를 갖는다.

아래 표는 이 포스트에서 다루는 핵심 연속 분포를 한눈에 정리한다.

분포	표기	지지 집합	핵심 역할
연속균등	\(\text{Uniform}(a,b)\)	\([a,b]\)	무정보 사전분포, PIT, 난수 생성 기반
정규	\(N(\mu, \sigma^2)\)	\((-\infty, \infty)\)	CLT 극한 분포, 오차 모델링의 표준
감마	\(\text{Gamma}(\alpha, \beta)\)	\((0, \infty)\)	대기시간, 적률, 베이지안 켤레 사전분포
지수	\(\text{Exp}(\beta)\)	\((0, \infty)\)	감마의 특수 케이스(\(\alpha=1\)), 무기억성
카이제곱	\(\chi^2(\nu)\)	\((0, \infty)\)	감마의 특수 케이스, 검정 통계량 분포
베타	\(\text{Beta}(\alpha, \beta)\)	\((0, 1)\)	비율 모델링, 베이지안 이항 켤레 사전분포
코시	\(\text{Cauchy}(\theta, \sigma)\)	\((-\infty, \infty)\)	중꼬리 분포, 평균·분산 미존재
로그정규	\(\text{LogNormal}(\mu, \sigma^2)\)	\((0, \infty)\)	소득·주가·생물학적 측정

2 정규 분포 (Normal Distribution)

2.1 정의

정의: 정규 분포

\(X \sim N(\mu, \sigma^2)\) 이면 PDF는:

\[ f_X(x \mid \mu, \sigma^2) = \frac{1}{\sqrt{2\pi}\,\sigma} \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), \quad x \in \mathbb{R} \]

직관: 정규 PDF의 각 항이 하는 역할

\[\frac{1}{\sqrt{2\pi}\,\sigma} \cdot \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\]

\(\exp(-\cdots)\) 항: 지수 함수의 인수가 음수이므로, 중심에서 멀어질수록 밀도가 급격히 0에 가까워진다. \((x-\mu)^2\) 이 이차식이므로 감소 속도는 거리의 제곱에 비례한다 — 이것이 종 모양 대칭 곡선의 원인이다.
\((x-\mu)^2\): 제곱 덕분에 양쪽 방향으로 동일하게 감소한다. 만약 \(|x-\mu|\) 처럼 절댓값을 썼다면 라플라스 분포(뾰족한 봉우리)가 된다.
\(2\sigma^2\) 분모: \(\sigma\) 가 클수록 지수 인수가 천천히 감소 → 곡선이 옆으로 넓게 퍼진다. \(\sigma\) 가 작을수록 급격히 감소 → 날카로운 봉우리가 된다.
\(1/(\sqrt{2\pi}\sigma)\): 전체 면적이 1이 되도록 정규화하는 상수이다. \(\sqrt{2\pi}\) 는 가우시안 적분 \(\int e^{-z^2/2}dz = \sqrt{2\pi}\) 에서 나온다.

\(\mu \in \mathbb{R}\): 위치 모수 (평균)
\(\sigma^2 > 0\): 척도 모수 (분산)

표준 정규: \(Z \sim N(0,1)\), PDF를 \(\phi(z)\), CDF를 \(\Phi(z)\)로 표기한다.

2.2 성질

성질	값
평균 \(E[X]\)	\(\mu\)
분산 \(\text{Var}(X)\)	\(\sigma^2\)
MGF \(M_X(t)\)	\(\exp(\mu t + \sigma^2 t^2/2)\)
중위수 = 최빈값	\(\mu\)
지수족 여부	O
위치-척도족 여부	O

정규화 상수 \(\sqrt{2\pi}\)의 유도: 가우시안 적분 \(\int_{-\infty}^\infty e^{-x^2/2} dx = \sqrt{2\pi}\) 를 이용한다 (Casella & Berger, 2002, Ch.3).

2.3 선형 변환 닫힘성

\(X \sim N(\mu, \sigma^2)\) 이면:

\[ aX + b \sim N(a\mu + b,\ a^2\sigma^2) \]

독립 정규 합: \(X_i \sim N(\mu_i, \sigma_i^2)\) 독립이면 \(\sum X_i \sim N(\sum \mu_i, \sum \sigma_i^2)\).

2.4 표준화와 CDF

\[ Z = \frac{X - \mu}{\sigma} \sim N(0,1), \quad P(X \le x) = \Phi\!\left(\frac{x-\mu}{\sigma}\right) \]

\(\Phi\)는 닫힌 형식이 없어 수치적으로 계산하거나 표를 이용한다.

2.5 68-95-99.7 규칙

\[ P(\mu - k\sigma \le X \le \mu + k\sigma) \approx \begin{cases} 0.6827 & k=1 \\ 0.9545 & k=2 \\ 0.9973 & k=3 \end{cases} \]

2.6 왜 정규 분포인가

중심극한정리(CLT)에 따르면, 유한 분산을 갖는 iid 확률변수의 표준화 합은 정규 분포로 수렴한다:

\[ \frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1) \quad (n \to \infty) \]

따라서 정규 분포는 특정 현상의 분포가 아니라 반복 측정의 극한 거동을 기술하는 도구이다.

3 감마 분포 (Gamma Distribution)

3.1 감마 함수

감마 분포의 정규화 상수는 감마 함수(Gamma function)에 기반한다:

\[ \Gamma(\alpha) = \int_0^\infty t^{\alpha-1} e^{-t} \, dt, \quad \alpha > 0 \]

핵심 성질: - \(\Gamma(\alpha+1) = \alpha \, \Gamma(\alpha)\) (재귀 관계) - \(\Gamma(n) = (n-1)!\) (\(n\) 양의 정수) - \(\Gamma(1/2) = \sqrt{\pi}\)

3.2 정의

정의: 감마 분포

\(X \sim \text{Gamma}(\alpha, \beta)\) 이면 PDF는:

\[ f_X(x \mid \alpha, \beta) = \frac{1}{\Gamma(\alpha)\,\beta^\alpha} x^{\alpha-1} e^{-x/\beta}, \quad x > 0 \]

직관: 감마 PDF의 각 항이 하는 역할

\[\frac{1}{\Gamma(\alpha)\beta^\alpha} \cdot x^{\alpha-1} \cdot e^{-x/\beta}\]

\(x^{\alpha-1}\) 항 (형상 모수 \(\alpha\)): \(\alpha > 1\) 이면 \(x=0\) 에서 밀도가 0이고 내부에서 봉우리가 생긴다. \(\alpha = 1\) 이면 \(x^0 = 1\) 이므로 단조감소하는 지수 분포가 된다. \(\alpha\) 가 클수록 분포가 오른쪽으로 이동하고 더 대칭적인 모양이 된다.
\(e^{-x/\beta}\) 항 (척도 모수 \(\beta\)): \(x\) 가 커질수록 밀도를 0으로 당기는 감쇠 항이다. \(\beta\) 가 클수록 감쇠가 느려져 분포가 오른쪽으로 늘어진다.
두 항의 경쟁: \(x^{\alpha-1}\) 은 \(x\) 가 커질수록 증가하고, \(e^{-x/\beta}\) 는 감소한다. 이 두 힘의 균형 지점이 최빈값 \((\alpha-1)\beta\) 이다.
포아송 과정에서 \(k\)번째 이벤트까지의 대기 시간이 \(\text{Gamma}(k, 1/\lambda)\) 를 따르는 이유는, \(k\) 번의 지수 분포 대기를 합산한 결과이기 때문이다.

\(\alpha > 0\): 형상 모수(shape parameter)
\(\beta > 0\): 척도 모수(scale parameter)

주의: 일부 교재·소프트웨어는 rate parameter \(\lambda = 1/\beta\)를 사용한다. 문맥을 확인한다.

3.3 성질

성질	값
평균 \(E[X]\)	\(\alpha\beta\)
분산 \(\text{Var}(X)\)	\(\alpha\beta^2\)
MGF \(M_X(t)\)	\((1 - \beta t)^{-\alpha}\), \(t < 1/\beta\)
지수족 여부	O

감마의 닫힘성(Closure): 독립 \(X_i \sim \text{Gamma}(\alpha_i, \beta)\)이면 \(\sum X_i \sim \text{Gamma}(\sum \alpha_i, \beta)\).

3.4 특수 케이스

지수 분포 (Exponential Distribution)

\[ X \sim \text{Exp}(\beta) \iff X \sim \text{Gamma}(1, \beta) \]

\[ f_X(x) = \frac{1}{\beta} e^{-x/\beta}, \quad x > 0 \]

\(E[X] = \beta\), \(\text{Var}(X) = \beta^2\)
무기억성: \(P(X > s+t \mid X > s) = P(X > t)\) — 지수 분포의 고유 성질
연속 분포 중 무기억성을 갖는 유일한 분포이다
응용: 고장 시간, 대기 시간 모델링

카이제곱 분포 (Chi-squared Distribution)

\[ X \sim \chi^2(\nu) \iff X \sim \text{Gamma}(\nu/2,\ 2) \]

\[ f_X(x) = \frac{1}{2^{\nu/2}\,\Gamma(\nu/2)} x^{\nu/2-1} e^{-x/2}, \quad x > 0 \]

\(\nu\): 자유도 (degrees of freedom)
\(E[X] = \nu\), \(\text{Var}(X) = 2\nu\)
독립 표준정규 합의 제곱: \(Z_1, \ldots, Z_\nu \sim N(0,1)\) 독립이면 \(\sum Z_i^2 \sim \chi^2(\nu)\)
응용: 적합도 검정, 분산 추정, 신뢰구간

감마 분포 가족 관계

\[ \text{Gamma}(\alpha, \beta) \begin{cases} \alpha = 1 \Rightarrow \text{Exp}(\beta) \\ \alpha = \nu/2,\ \beta = 2 \Rightarrow \chi^2(\nu) \end{cases} \]

포아송 과정에서 \(k\)번째 사건까지의 대기 시간 \(\sim \text{Gamma}(k, 1/\lambda)\) (rate \(\lambda\)).

4 베타 분포 (Beta Distribution)

4.1 베타 함수

\[ B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} \, dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)} \]

4.2 정의

정의: 베타 분포

\(X \sim \text{Beta}(\alpha, \beta)\) 이면 PDF는:

\[ f_X(x \mid \alpha, \beta) = \frac{1}{B(\alpha,\beta)} x^{\alpha-1}(1-x)^{\beta-1}, \quad x \in (0,1) \]

직관: 베타 PDF의 각 항이 하는 역할

\[\frac{1}{B(\alpha,\beta)} \cdot x^{\alpha-1} \cdot (1-x)^{\beta-1}\]

\(x^{\alpha-1}\) 항: \(x=0\) 근방의 밀도를 결정한다. \(\alpha > 1\) 이면 \(x=0\) 에서 밀도가 0 (0을 기피), \(\alpha < 1\) 이면 0 근방에서 밀도가 폭발적으로 증가 (0을 선호), \(\alpha = 1\) 이면 중립.
\((1-x)^{\beta-1}\) 항: 같은 방식으로 \(x=1\) 근방의 밀도를 결정한다. \(\beta\) 가 클수록 1 근방을 기피한다.
대칭성: \(\alpha = \beta\) 이면 두 항이 대칭이므로 분포가 0.5를 중심으로 대칭이다. \(\alpha > \beta\) 이면 오른쪽에 더 높은 밀도 (높은 값 선호), \(\alpha < \beta\) 이면 왼쪽에 더 높은 밀도.
베이지안 해석: 성공률 \(p\) 에 대한 사전 정보가 없을 때 \(\text{Beta}(1,1) = \text{Uniform}(0,1)\) 을 쓴다. \(n\) 번 시행에서 \(s\) 번 성공한 후 사후 분포는 \(\text{Beta}(1+s, 1+n-s)\) 가 된다 — \(\alpha\) 는 “관찰된 성공 수 + 1”, \(\beta\) 는 “관찰된 실패 수 + 1”로 해석된다.

\(\alpha, \beta > 0\): 형상 모수

4.3 성질

성질	값
평균 \(E[X]\)	\(\dfrac{\alpha}{\alpha+\beta}\)
분산 \(\text{Var}(X)\)	\(\dfrac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\)
MGF	닫힌 형식 없음 (초기하급수)
지수족 여부	O

4.4 형상 모수에 따른 형태

\(\alpha\), \(\beta\) 관계	분포 형태
\(\alpha = \beta = 1\)	균등 분포 \(\text{Uniform}(0,1)\)
\(\alpha = \beta > 1\)	대칭 종 모양
\(\alpha > \beta\)	오른쪽 치우침 (우편향)
\(\alpha < \beta\)	왼쪽 치우침 (좌편향)
\(\alpha, \beta < 1\)	U자형

4.5 왜 베타 분포인가

비율(proportion), 확률, 순서통계량 등 \((0,1)\) 구간의 값을 모델링하는 데 자연스러운 분포이다.

베이지안 이항 켤레 사전분포: 이항 가능도에 베타 사전분포를 쓰면 사후분포도 베타이다
균등 분포의 일반화: \(\text{Beta}(1,1) = \text{Uniform}(0,1)\)
균등 분포의 순서통계량: \(X_{(k)} \sim \text{Beta}(k, n-k+1)\)

5 코시 분포 (Cauchy Distribution)

5.1 정의

정의: 코시 분포

\(X \sim \text{Cauchy}(\theta, \sigma)\) 이면 PDF는:

\[ f_X(x \mid \theta, \sigma) = \frac{1}{\pi\sigma\left[1 + \left(\frac{x-\theta}{\sigma}\right)^2\right]}, \quad x \in \mathbb{R} \]

직관: 코시 분포 — 왜 꼬리가 이렇게 두꺼운가

코시 PDF의 분모는 \(1 + \left(\frac{x-\theta}{\sigma}\right)^2\) 이다. 이것은 \(|x|\) 가 커질수록 \(x^2\) 에 비례해서 커진다 — 밀도가 \(1/x^2\) 속도로 감소한다는 뜻이다.

반면 정규 분포는 \(e^{-x^2/2}\) 속도로 감소하는데, 지수 함수가 다항 함수보다 훨씬 빠르게 감소한다. 따라서 코시 분포의 꼬리는 정규 분포보다 훨씬 두껍다.

꼬리가 두꺼우면 왜 평균이 없는가: 평균을 계산하려면 \(\int |x| f(x) dx\) 가 유한해야 한다. 코시의 경우 \(\int |x| \cdot \frac{1}{1+x^2} dx \sim \int \frac{|x|}{x^2} dx = \int \frac{1}{|x|} dx\) 인데, 이 적분은 발산한다. \(1/x^2\) 감소가 \(|x|\) 증가를 상쇄하기에 충분하지 않기 때문이다.

직관적 비유: 코시 분포를 따르는 값의 평균을 아무리 많은 표본으로 추정해도, 표본 평균은 수렴하지 않는다. 극단적 이상치가 너무 자주 나타나 표본 평균을 계속 끌어당기기 때문이다.

\(\theta \in \mathbb{R}\): 위치 모수 (중위수이자 최빈값)
\(\sigma > 0\): 척도 모수

5.2 특이성: 평균과 분산이 존재하지 않는다

코시 분포는 꼬리가 매우 두꺼워 \(\int |x| f(x) dx = \infty\) 이므로 \(E[X]\)가 존재하지 않는다.

\[ E[|X|] = \infty \Rightarrow E[X] \text{ 미존재} \]

따라서 분산과 MGF도 존재하지 않는다. 중꼬리(heavy-tail) 분포의 대표적 예이다.

표준 코시: \(Z = X/Y\) (\(X, Y \sim N(0,1)\) 독립) \(\sim \text{Cauchy}(0,1)\).

표준 코시는 자유도 1인 \(t\) 분포와 동일하다: \(\text{Cauchy}(0,1) = t(1)\).

5.3 왜 코시 분포인가

중심극한정리가 적용되지 않는 반례 — iid 코시 표본 평균도 코시 분포를 따른다
로버스트 회귀, 신호처리에서 이상치(outlier)가 많은 오차 모형으로 사용된다
물리학에서 공명(resonance) 현상의 선폭(line width) 모형 (로렌츠 분포)

6 로그정규 분포 (Log-normal Distribution)

6.1 정의

정의: 로그정규 분포

\(X > 0\) 이고 \(\log X \sim N(\mu, \sigma^2)\) 이면 \(X \sim \text{LogNormal}(\mu, \sigma^2)\):

\[ f_X(x \mid \mu, \sigma^2) = \frac{1}{x\sqrt{2\pi}\,\sigma} \exp\!\left(-\frac{(\log x - \mu)^2}{2\sigma^2}\right), \quad x > 0 \]

직관: 로그정규 PDF — 왜 이런 형태인가

로그정규 분포의 PDF는 정규 분포의 PDF에서 변수 변환 \(x \to \log x\) 를 적용한 결과이다.

\[f_X(x) = f_Z(\log x) \cdot \left|\frac{d(\log x)}{dx}\right| = \phi\!\left(\frac{\log x - \mu}{\sigma}\right) \cdot \frac{1}{x\sigma}\]

\(1/x\) 항: 변수 변환의 야코비안이다. \(x\) 가 작을수록 \(\log x\) 의 변화율이 크므로(도함수 \(1/x\) 가 크다), 작은 \(x\) 근방에 더 많은 확률 질량이 밀집된다.
\(\exp(-(\log x - \mu)^2/...)\) 항: 로그 척도에서 정규 분포의 종 모양을 만든다.
항상 오른쪽 치우침: 로그 변환의 비대칭성 때문에 선형 척도에서는 항상 긴 오른쪽 꼬리가 생긴다. 평균 \(e^{\mu+\sigma^2/2} >\) 중위수 \(e^\mu >\) 최빈값 \(e^{\mu-\sigma^2}\) 순서가 항상 성립한다.

직관적 비유: 소득, 주가, 세균 수처럼 “더하기”가 아니라 “곱하기”로 성장하는 현상이 로그정규를 따른다. 소득이 매년 5%~20% 성장(곱셈적)하면, 수십 년 후 소득의 로그 값은 정규 분포에 가까워진다(CLT의 곱셈 버전).

6.2 성질

성질	값
평균 \(E[X]\)	\(e^{\mu + \sigma^2/2}\)
분산 \(\text{Var}(X)\)	\((e^{\sigma^2}-1)\,e^{2\mu+\sigma^2}\)
중위수	\(e^\mu\)
최빈값	\(e^{\mu - \sigma^2}\)

평균 \(>\) 중위수 \(>\) 최빈값 — 항상 오른쪽 치우침이다.

6.3 왜 로그정규 분포인가

로그를 취하면 정규가 되는 현상에 등장한다:

소득 분포, 주가 수익률 (곱셈적 성장)
생물학적 측정 (세포 크기, 박테리아 수)
생존 분석에서 생존 시간

정규 분포가 덧셈의 극한이라면, 로그정규 분포는 곱셈의 극한이다.

7 이중지수 분포 / 라플라스 분포 (Laplace Distribution)

::: {.callout-note} ## 정의: 라플라스 분포

\(X \sim \text{Laplace}(\mu, b)\) 이면:

\[ f_X(x) = \frac{1}{2b} \exp\!\left(-\frac{|x - \mu|}{b}\right), \quad x \in \mathbb{R} \]

직관: 라플라스 분포 — 절댓값이 만드는 날카로운 봉우리

라플라스 PDF의 핵심은 지수 함수의 인수에 \(|x - \mu|\) (절댓값)가 들어간다는 점이다.

정규 분포는 \((x-\mu)^2\) (이차식) 을 사용 → 봉우리 근방에서 완만하게 감소 (이차 곡선처럼 매끄러운 산 모양)
라플라스 분포는 \(|x-\mu|\) (일차 절댓값) 을 사용 → \(x = \mu\) 에서 날카로운 꺾임 발생, 봉우리가 뾰족함
라플라스는 정규보다 중심에 더 집중되어 있고(뾰족), 동시에 꼬리도 더 두꺼워서 이상치가 더 자주 나온다.

Lasso 회귀와의 연결: Lasso의 L1 페널티 \(\lambda \sum |\beta_j|\) 는 회귀 계수 \(\beta\) 에 라플라스 사전분포를 부여하는 것과 동일하다. \(|x-0|\) 형태의 라플라스 분포는 0에서 날카로운 봉우리를 가지므로, MAP 추정이 많은 계수를 정확히 0으로 추정하도록(희소성) 유도한다.

\(E[X] = \mu\), \(\text{Var}(X) = 2b^2\)
정규보다 뾰족하고 꼬리가 두꺼운 레프토커틱(leptokurtic) 분포
Lasso 회귀(L1 페널티)는 라플라스 사전분포를 MAP 추정으로 해석할 수 있다

8 연속 분포 상호 관계

Uniform(0,1)
    │
    ├─ PIT: 모든 연속 분포로 변환 가능
    │
    └─ Beta(1,1) = Uniform(0,1)

Normal(μ, σ²)
    │
    ├─ exp(Normal) = LogNormal
    ├─ Z²  = Chi²(1)  ──┐
    └─ Z₁/Z₂  = Cauchy(0,1)  │
                            ↓
Gamma(α, β)               Chi²(ν) = Gamma(ν/2, 2)
    │                        │
    └─ α=1: Exp(β)           └─ 표준정규 ν개의 제곱합

Beta(α, β)
    └─ 균등의 순서통계량 X_(k) ~ Beta(k, n-k+1)

변환 관계	설명
\(Z \sim N(0,1) \Rightarrow Z^2 \sim \chi^2(1)\)	카이제곱은 표준정규의 제곱
\(\sum_{i=1}^\nu Z_i^2 \sim \chi^2(\nu)\)	카이제곱의 닫힘성
\(X \sim N, Y \sim \chi^2(\nu) \Rightarrow \frac{X}{\sqrt{Y/\nu}} \sim t(\nu)\)	\(t\) 분포 생성
\(\frac{\chi^2(m)/m}{\chi^2(n)/n} \sim F(m,n)\)	\(F\) 분포 생성
\(\log X \sim N \Rightarrow X \sim \text{LogNormal}\)	로그-정규 연결
\(\text{Beta}(1,1) = \text{Uniform}(0,1)\)	베타의 특수 케이스
\(\text{Gamma}(1,\beta) = \text{Exp}(\beta)\)	감마의 특수 케이스

9 분포별 성질 요약 테이블

분포	평균	분산	MGF 존재	지지	지수족
\(N(\mu,\sigma^2)\)	\(\mu\)	\(\sigma^2\)	O	\(\mathbb{R}\)	O
\(\text{Gamma}(\alpha,\beta)\)	\(\alpha\beta\)	\(\alpha\beta^2\)	O (\(t<1/\beta\))	\((0,\infty)\)	O
\(\text{Exp}(\beta)\)	\(\beta\)	\(\beta^2\)	O (\(t<1/\beta\))	\((0,\infty)\)	O
\(\chi^2(\nu)\)	\(\nu\)	\(2\nu\)	O (\(t<1/2\))	\((0,\infty)\)	O
\(\text{Beta}(\alpha,\beta)\)	\(\frac{\alpha}{\alpha+\beta}\)	\(\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\)	O (급수)	\((0,1)\)	O
\(\text{Cauchy}(\theta,\sigma)\)	미존재	미존재	X	\(\mathbb{R}\)	X
\(\text{LogNormal}(\mu,\sigma^2)\)	\(e^{\mu+\sigma^2/2}\)	\((e^{\sigma^2}-1)e^{2\mu+\sigma^2}\)	X	\((0,\infty)\)	X
\(\text{Laplace}(\mu,b)\)	\(\mu\)	\(2b^2\)	O (\(\|t\|<1/b\))	\(\mathbb{R}\)	O

10 코드 예시

10.1 Step 1: 순수 Python — PDF 직접 구현

import math

# 정규 분포 PDF
def normal_pdf(x, mu=0, sigma=1):
    return (1 / (math.sqrt(2 * math.pi) * sigma)) * math.exp(-0.5 * ((x - mu) / sigma) ** 2)

# 감마 분포 PDF (shape=alpha, scale=beta)
def gamma_pdf(x, alpha, beta):
    if x <= 0:
        return 0.0
    return (x ** (alpha - 1) * math.exp(-x / beta)) / (math.gamma(alpha) * beta ** alpha)

# 지수 분포 PDF — Gamma(1, beta)
def exp_pdf(x, beta):
    return gamma_pdf(x, alpha=1, beta=beta)

# 베타 분포 PDF
def beta_func(a, b):
    return math.gamma(a) * math.gamma(b) / math.gamma(a + b)

def beta_pdf(x, alpha, beta):
    if not 0 < x < 1:
        return 0.0
    return x ** (alpha - 1) * (1 - x) ** (beta - 1) / beta_func(alpha, beta)

# 검증: 각 PDF의 대표값 계산
print("=== 정규 분포 N(0,1) ===")
print(f"f(0) = {normal_pdf(0):.6f}  (이론: {1/math.sqrt(2*math.pi):.6f})")

print("\n=== 감마 분포 Gamma(2, 3) ===")
x = 3.0  # 평균 = alpha*beta = 6
print(f"f(3) = {gamma_pdf(3, alpha=2, beta=3):.6f}")
print(f"E[X] = {2*3} (alpha*beta)")

print("\n=== 지수 분포 Exp(2) ===")
print(f"f(1) = {exp_pdf(1, beta=2):.6f}  (이론: {(1/2)*math.exp(-1/2):.6f})")
print(f"무기억성 P(X>3|X>1) = P(X>2): {math.exp(-2/2):.6f}")

print("\n=== 베타 분포 Beta(2,5) ===")
print(f"f(0.2) = {beta_pdf(0.2, alpha=2, beta=5):.6f}")
print(f"E[X] = {2/(2+5):.4f}  (이론: alpha/(alpha+beta))")

10.2 Step 2: scipy.stats — 연속 분포 비교

import numpy as np
from scipy import stats

# 각 분포 객체 생성
distributions = {
    "Normal(0,1)":      stats.norm(loc=0, scale=1),
    "Gamma(2,3)":       stats.gamma(a=2, scale=3),
    "Exp(2)":           stats.expon(scale=2),
    "Chi2(5)":          stats.chi2(df=5),
    "Beta(2,5)":        stats.beta(a=2, b=5),
    "LogNormal(0,0.5)": stats.lognorm(s=0.5, scale=np.exp(0)),
    "Cauchy(0,1)":      stats.cauchy(loc=0, scale=1),
}

print(f"{'분포':<22} {'Mean':>10} {'Var':>12} {'Median':>10}")
print("-" * 58)
for name, dist in distributions.items():
    try:
        mean = dist.mean()
        var  = dist.var()
        med  = dist.median()
        print(f"{name:<22} {mean:>10.4f} {var:>12.4f} {med:>10.4f}")
    except Exception:
        print(f"{name:<22} {'N/A':>10} {'N/A':>12} {'N/A':>10}")

분포                       Mean          Var     Median
----------------------------------------------------------
Normal(0,1)                0.0000       1.0000     0.0000
Gamma(2,3)                 6.0000      18.0000     5.3063
Exp(2)                     2.0000       4.0000     1.3863
Chi2(5)                    5.0000      10.0000     4.3515
Beta(2,5)                  0.2857       0.0255     0.2633
LogNormal(0,0.5)           1.1331       0.3524     1.0000
Cauchy(0,1)                   N/A          N/A     0.0000

10.3 Step 3: 분포 선택 가이드 — 데이터 유형별

import numpy as np
from scipy import stats

# 시나리오 1: 양수 대기 시간 데이터 → 감마/지수 적합
np.random.seed(42)
wait_times = np.random.exponential(scale=5, size=200)  # 평균 5분 대기

# 지수 분포 적합
scale_hat = wait_times.mean()  # MLE: beta = x_bar
ks_stat, p_value = stats.kstest(wait_times, 'expon', args=(0, scale_hat))
print(f"=== 대기 시간 → 지수 분포 적합 ===")
print(f"MLE scale = {scale_hat:.3f}  (참: 5.0)")
print(f"KS test p-value = {p_value:.4f}  ({'적합' if p_value > 0.05 else '부적합'})")

# 시나리오 2: 비율 데이터 → 베타 적합
click_rates = np.random.beta(a=2, b=8, size=200)  # 전환율 ~ Beta(2,8)
alpha_hat, beta_hat, _, _ = stats.beta.fit(click_rates, floc=0, fscale=1)
print(f"\n=== 전환율 → 베타 분포 적합 ===")
print(f"MLE alpha = {alpha_hat:.3f} (참: 2.0),  beta = {beta_hat:.3f} (참: 8.0)")
print(f"E[X] = {alpha_hat/(alpha_hat+beta_hat):.4f}  (참: {2/(2+8):.4f})")

# 시나리오 3: 양수 데이터가 곱셈적 구조 → 로그정규
incomes = np.random.lognormal(mean=10.5, sigma=0.8, size=500)
mu_hat = np.log(incomes).mean()
sigma_hat = np.log(incomes).std()
print(f"\n=== 소득 데이터 → 로그정규 적합 ===")
print(f"MLE mu = {mu_hat:.3f} (참: 10.5),  sigma = {sigma_hat:.3f} (참: 0.8)")
print(f"중위수 = {np.exp(mu_hat):.1f},  평균 = {np.exp(mu_hat + sigma_hat**2/2):.1f}")

11 분포 선택 지침

어떤 연속 분포를 선택할지는 데이터의 지지 집합과 형태에 따라 결정된다:

데이터 특성	후보 분포	이유
\((-\infty, \infty)\), 대칭, 가벼운 꼬리	Normal	CLT, 오차 모델
\((-\infty, \infty)\), 대칭, 무거운 꼬리	Cauchy, \(t(\nu)\)	이상치 내성
\((0, \infty)\), 양의 치우침	Gamma, LogNormal	대기시간, 소득
\((0, \infty)\), 무기억성	Exponential	포아송 과정 간격
\((0, 1)\), 비율·확률	Beta	이항 켤레
검정 통계량	\(\chi^2\), \(t\), \(F\)	표본 분포 이론

12 관련 주제

선행 지식

후속 주제 (개별 포스트)

관련 개념

적률과 적률생성함수 — MGF로 분포를 특성화
확률변수 함수의 분포 — 정규 → 카이제곱 변환
MLE — 연속 분포의 모수 추정