변수의 유형과 역할

통계적 모형에서 변수의 분류 — 역할별, 척도별, 구조방정식 관점

통계 분석에서 변수를 분류하는 두 축(역할과 척도)을 정리한다. 독립·종속·매개·조절·외생· 내생·억압·통제 변수의 정의와 실무 예시, 이산·연속·질적·양적 변수의 구분, 그리고 연구 설계에서 변수 통제의 중요성을 다룬다.

Statistics
저자

Kwangmin Kim

공개

2026년 04월 06일

1 개요

통계 모형을 설계할 때 가장 먼저 하는 일은 변수를 분류하는 것이다. 분류 기준은 크게 두 가지다:

  1. 역할(role): 모형 안에서 변수가 맡는 기능 — 원인인가, 결과인가, 둘 사이를 매개하는가
  2. 척도(scale): 변수가 담는 정보의 수학적 성격 — 이산인가, 연속인가, 순서가 있는가

이 두 축을 명확히 이해하지 않으면 회귀 분석, ANOVA, 구조방정식 등 어떤 기법도 올바르게 적용할 수 없다.


2 기본 용어: 개념, 변수, 상수

용어 정의 예시
개념(Concept) 현상을 추상적으로 구성한 관념 “성(gender)”
변수(Variable) 한 연속선상에서 둘 이상의 값을 갖는 개념 “성별(sex)” — 남, 여
상수(Constant) 변하지 않는 단일 값 “남자”, “여자” 각각은 상수

변수는 변한다는 점에서 상수와 구분된다. 통계 모형은 변수 간의 관계를 수학적으로 표현하는 도구이다.


3 역할별 변수 분류

3.1 독립변수 (Independent Variable)

원인이 되는 변수이다. 설명변수(explanatory variable), 예측변수(predictor)라고도 부른다. 조건문 구조에서 “if” 절에 해당한다.

  • “사람이 운동을 하면 근육량이 늘어난다”에서 운동 유무가 독립변수이다
  • 회귀에서 \(x\), ANOVA 에서 처치(treatment)에 해당한다

3.2 종속변수 (Dependent Variable)

독립변수에 의해 영향을 받는 변수이다. 반응변수(response variable), 결과변수(outcome)라고도 부른다. 인과 관계에서 결과(effect) 를 나타낸다.

  • 위 예시에서 근육량이 종속변수이다
  • 회귀에서 \(Y\), ANOVA 에서 관측치에 해당한다

\[ \text{운동 (독립변수)} \;\longrightarrow\; \text{근육량 (종속변수)} \]

3.3 매개변수 (Mediating Variable)

독립변수와 종속변수 사이에 개입하여, 독립변수의 효과를 간접적으로 전달하는 변수이다. 매개변수는 독립변수의 결과인 동시에 종속변수의 원인이다.

\[ \text{독립변수} \;\longrightarrow\; \text{매개변수} \;\longrightarrow\; \text{종속변수} \]

예시: 경제 상태 → 여가 문화 → 삶의 만족도
  • 독립변수: 경제 상태
  • 매개변수: 여가 문화 활동
  • 종속변수: 삶의 만족도
  • 경제적 여유가 여가 활동을 가능하게 하고, 여가 활동이 삶의 만족도를 높인다
  • 경제 상태 → 삶의 만족도의 직접 효과는 약할 수 있지만, 여가 문화를 통한 간접 효과가 존재한다

데이터 분석에서의 검증 조건:

  1. 독립변수와 종속변수 간 유의한 상관이 있어야 한다
  2. 독립변수와 매개변수 간 유의한 상관이 있어야 한다
  3. 매개변수와 종속변수 간 유의한 상관이 있어야 한다
  4. 완전 매개: 매개변수를 모형에 넣으면 독립변수의 유의성이 사라진다
  5. 부분 매개: 독립변수의 유의성이 낮아지지만 완전히 사라지지는 않는다

한계: 매개변수는 종종 성격, 태도, 문화처럼 가상적 구성물(construct)이어서 정량화가 어렵다.

3.4 조절변수 (Moderating Variable)

독립변수가 종속변수에 미치는 영향의 강도, 방향을 변화시키는 변수이다. 매개변수와 달리 인과 경로에 직접 개입하지 않고, 관계의 맥락을 바꾼다.

\[ \text{독립변수} \;\xrightarrow{\;\text{조절변수}\;}\; \text{종속변수} \]

예시: 교사 지지도에 따른 따돌림 → 자존감
  • 독립변수: 집단 따돌림 수준
  • 종속변수: 학생의 자존감
  • 조절변수: 교사의 지지도
  • 교사의 지지가 높으면 따돌림이 자존감에 미치는 악영향이 완화된다
  • 교사의 지지가 낮으면 악영향이 증폭된다

데이터 분석에서의 검증:

  1. 독립변수와 종속변수 간 유의한 상관
  2. 회귀 모형에 독립변수 \(\times\) 조절변수 교호작용항(interaction term)을 포함했을 때 유의

3.5 외생변수 (Extraneous Variable)

독립변수 외에 종속변수에 영향을 주는 제3의 변수이다. 통제하지 않으면 허위 관계(spurious relationship)를 만들어낸다.

\[ \text{독립변수} \;\xleftarrow{+}\; \text{외생변수} \;\xrightarrow{+}\; \text{종속변수} \]

예시: “무릎이 쑤시면 비가 온다”
  • 외생변수: 대기압
  • 대기압이 낮으면 비구름이 이동하여 비가 내린다 (대기압 → 비)
  • 동시에 대기압이 낮으면 체내 기압 차이로 관절 통증이 발생한다 (대기압 → 무릎 통증)
  • 대기압을 통제하면 무릎 통증과 비 사이의 “관계”는 사라진다

외생변수를 간과하면 선택 편향(selection bias), 표본추출 편향(sampling bias), 생존자 편향(survivorship bias), 무응답 편향(nonresponse bias) 등이 발생한다.

3.6 내생변수 (Endogenous Variable)

구조방정식(SEM) 용어로, 다른 변수로부터 영향을 받는 변수이다. 모형 안에서 그 값이 결정된다. 회귀에서의 종속변수에 해당한다.

\[ \text{외생변수 (원인)} \;\longrightarrow\; \text{내생변수 (결과)} \]

3.7 억압변수 (Suppressor Variable)

원래 관계가 있는 두 변수를 관계가 없는 것처럼 보이게 하는 변수이다. 외생변수의 반대 방향이다.

\[ \text{독립변수} \;\xleftarrow{+}\; \text{억압변수} \;\xrightarrow{-}\; \text{종속변수} \]

독립변수와는 양의 상관, 종속변수와는 음의 상관(또는 그 반대)이 있어 두 효과가 상쇄된다. 억압변수를 통제하면 독립변수와 종속변수의 참된 관계가 드러난다.

예시: 교육 수준 → 소득 (고령자 맥락)
  • 억압변수: 고령 여부
  • 교육 수준이 높은 고령자는 젊었을 때 높은 소득을 누렸지만, 은퇴 후 현재 소득은 낮을 수 있다
  • 고령 여부를 통제하지 않으면 “교육 수준이 높으면 소득이 낮다”는 역전된 결론이 나올 수 있다

3.8 통제변수 (Control Variable)

독립변수와 종속변수의 인과 관계에 영향을 줄 수 있는 제3의 변수 중, 연구자가 분석 과정에서 의도적으로 일정하게 유지하거나 보정하는 변수이다.

통제변수의 목적은 관심 독립변수의 종속변수에 대한 순수 효과(net effect)를 관찰하는 것이다. 외생변수, 매개변수, 조절변수, 억압변수 모두가 통제 대상이 될 수 있다.


4 변수 역할 비교 요약

변수 유형 핵심 기능 모형에서의 위치 통제 필요성
독립변수 원인 제공 \(X\)
종속변수 결과 관측 \(Y\)
매개변수 간접 효과 전달 \(X \to M \to Y\) 분석적 분리
조절변수 효과 강도/방향 변경 \(X \times W\) 교호작용 교호작용항 포함
외생변수 허위 관계 생성 \(Z \to X, Z \to Y\) 반드시 통제
억압변수 참된 관계 은폐 \(S \to X(+), S \to Y(-)\) 반드시 통제
통제변수 순수 효과 확보 모형에 포함 or 고정 설계 단계에서 결정

5 척도별 변수 분류

5.1 이산변수 (Discrete Variable)

명목척도(nominal)나 서열척도(ordinal)로 측정되는 변수이다. 값 사이에 중간값이 존재하지 않는다.

  • 명목: 성별(남, 여), 혈액형(A, B, AB, O) — 순서 없음
  • 서열: 학점(A, B, C, D), 만족도(매우 불만~매우 만족) — 순서 있으나 간격 불균등

5.2 연속변수 (Continuous Variable)

등간척도(interval)나 비율척도(ratio)로 측정되는 변수이다. 값 사이에 무한히 많은 중간값이 존재한다.

  • 등간: 온도(섭씨) — 0도가 “없음”을 의미하지 않음
  • 비율: 키, 몸무게, 소득 — 0이 절대 영점, 비율 연산 가능

5.3 질적변수 vs 양적변수

질적변수 (Qualitative) 양적변수 (Quantitative)
의미 범주·속성이 중요 수치·크기가 중요
예시 성별, 종교, 직업 키, 연령, 소득
척도 명목, 서열 등간, 비율
분석 도구 카이제곱 검정, 로지스틱 회귀 \(t\)-검정, ANOVA, 선형 회귀

6 연구 설계에서의 변수 통제

변수를 올바르게 분류하고 통제하는 것은 내적 타당성(internal validity)의 핵심이다.

위협 원인 대응
선택 편향 표본이 모집단을 대표하지 못함 무작위 추출
할당 편향 처치군과 대조군의 사전 차이 무작위 배정, 매칭
교란 외생변수 미통제 층화, 회귀 보정, 성향점수
허위 관계 외생변수에 의한 가짜 상관 편상관, 다중 회귀
억압 효과 억압변수에 의한 관계 은폐 탐색적 분석, 하위그룹 분석

7 관련 주제

선행 지식

후속 주제

Subscribe

Enjoy this blog? Get notified of new posts by email: