행동 데이터 이해 — 인간 행동의 5요소 모형 (Buisson Ch.2 overview)

Personal · Cognition · Intentions · Actions · Business — 데이터 뒤의 행동을 읽는 법

Buisson (2021) Ch.2 의 전체 흐름을 압축한 overview. 인간 행동을 5 구성요소 (개인 특성·인지/감정·의도·행동·비즈니스 행동) 로 분해하는 모형을 도입하고, 데이터 변수를 이 5 요소에 어떻게 매핑하는지, 의도-행동 간극(intention-action gap) 이 분석을 어떻게 망가뜨리는지를 정리한다. 미드라이프 크라이시스·C-Mart·AirCnC 사례로 이론을 직관화한다.

Experimentation
Causal Inference
저자

Kwangmin Kim

공개

2026년 05월 08일

1 정의

정의: 행동 데이터 (Behavioral Data)

사람의 관찰 가능한 행동(actions) 과 그 행동의 인과 요인 을 담은 데이터다. 단순 “사용자 ID · 클릭 수” 같은 표면 변수가 아니라, 그 행동을 만든 더 깊은 모수 — 개인 특성, 인지·감정, 의도 — 를 함께 측정·추론하는 분석을 행동 데이터 분석(Behavioral Data Analysis) 이라 부른다 (Buisson, 2021, Ch.2).

직관 — 영화 The Matrix 의 비유

Buisson 자신이 사용하는 비유다. 주인공이 세상을 볼 때 그 뒤의 숫자(코드)가 보이듯, 분석가가 데이터를 볼 때 그 뒤의 행동을 볼 수 있어야 한다.

“in this chapter you’ll learn to look at your data and see the behaviors behind it.”

데이터 = 표면. 행동 = 그 뒤의 진짜 작동 원리. 표면을 분석하면 표면적 결론밖에 못 낸다. 행동을 보아야 인과 분석이 가능하다.

2 개념 및 원리 — 인간 행동의 5 구성요소 모형

Buisson 은 책의 분석 단계를 위해 단순화된 행동 모형을 제안한다. 5 구성요소가 인과 사슬을 이룬다.

Personal Characteristics → Cognition·Emotions → Intentions → Actions
        ↑                          ↑                  ↑          ↑
        └──────── Business Behaviors ────────────────┴──────────┘

비즈니스 행동(Business Behaviors) 은 분석가·기업이 통제 가능한 변수 — 광고, 가격, UX, 정책 — 로, 위 사슬의 모든 단계에 영향을 미친다.

2.1 1. Personal Characteristics (개인 특성)

정의

분석 시간 frame 안에서 거의 변하지 않거나 매우 천천히 변하는 개인 정보. Buisson 은 이를 “primary causes” 로 정의한다 — 무한 회귀를 피하기 위해, 이 변수의 변화는 추적하지만 그 변화의 원인은 추적하지 않는다.

포함되는 것:

  • 인구통계 (나이·성별·가족 구성)
  • 성격 특질 (Big Five — 외향성·신경증 등)
  • 생활 습관·라이프스타일
직관 — 성격과 행동의 인과 관계

“성격이 구매를 일으킨다” 는 사회결정론처럼 들릴 수 있다. Buisson 의 답은 “확률적 기여 요인(probabilistic contributing factor)” 이다.

  • 40대가 되었다 → 미드라이프 크라이시스의 필요조건도 충분조건도 아님
  • 미드라이프 크라이시스 → 빨간 콜벳 구매의 필요조건도 충분조건도 아님

각 단계는 확률적 기여. “40대 → 더 높은 미드라이프 크라이시스 확률 → 더 높은 콜벳 구매 확률” 의 인과 사슬은 모든 사람에게 결정론적으로 작동하지 않지만, 집단 평균 으로 보면 의미있는 효과가 있다.

이 확률적 인과를 다루는 정확한 도구가 Hernan 정통 lens 의 잠재적 결과(potential outcomes) \(Y^a\) 표기 — Causal_Inference/02 에서 다룸.

2.1.1 인구통계 vs 더 깊은 모수

“법 집행관 + 간호사 = 성별 편향” 함정

미국 (그리고 많은 국가) 에서 법 집행과 간호 직군은 여전히 성별로 강하게 구분된다. 이 데이터를 놓고:

  • 표면 분석: “성별 → 직업” 인과 관계 — 흥미롭지도 실용적이지도 않음
  • 깊은 분석: “성별 → 권위·돌봄에 대한 사회 표상·규범 → 직업” — 더 흥미롭고 실용적
직관 — Why this matters for analytics

인구통계 변수는 proxy 다. 진짜 인과 변수는 더 깊은 곳 (사회 표상, 역할 모델 부재, 자기 영속 기제) 에 있다.

비즈니스 의사결정에 활용하려면:

  • “여성 고객은 X 를 구매한다” → “왜?” 까지 안 가면 캠페인 설계가 안 된다.
  • “왜?” 의 답은 보통 인지·감정 단계에 있다 (다음 §).

2.2 2. Cognition and Emotions (인지·감정)

정의

의식적·무의식적 사고와 감정 상태 — Buisson 은 이를 비즈니스 영역에서 다음과 매핑한다.

  • 고객 만족도 (CSAT), 순추천지수 (NPS), 고객 경험 (CX) 같은 비즈니스 지표
  • 행동과학·심리학에서의 동기·태도·신념
직관 — UX 연구 vs 행동과학의 관점 차이

같은 “고객 경험” 을 두고도 분야마다 강조점이 다르다.

분야 강조 측정 도구
UX 연구 사용자가 어떻게 느끼는가 (경험의 질) 정성 인터뷰, 사용성 테스트, 만족도
행동과학 그 느낌이 어떻게 행동으로 전환되는가 (의도-행동 사슬) 실험, 행동 추적, A/B 테스트

분석가는 두 관점을 연결하는 다리다. CSAT 가 90 점이라도 재구매 의도 가 낮으면 비즈니스 가치가 없다. CSAT (인지·감정) → 의도 → 행동의 사슬 전체를 봐야 한다.

2.3 3. Intentions (의도)

정의: 의도-행동 간극 (Intention-Action Gap)

사람들이 “하겠다” 고 한 것과 실제 행동 사이의 차이. Buisson 은 이 간극을 분석가가 항상 의식해야 한다고 강조한다.

직관 — “운동을 시작하겠다” 의 데이터

신년 결심 데이터를 보면:

  • 운동 결심: 50% 의 사람이 “올해는 운동하겠다” 고 선언
  • 6개월 후: 그 중 12% 만이 실제로 주 1회 이상 운동

의도 → 행동 의 전환율이 24%. 즉 의도 데이터로 행동을 예측하면 75% 의 사람이 “거짓말” 한 것처럼 보인다.

비즈니스 의사결정의 함의:

  • 설문조사로 “이 신상품 사실 건가요?” 묻고 75% 가 “예” 답 → 실제 구매율은 20% 수준
  • 연간 구독 환불 의사 조사 → 응답자보다 실제 환불자가 훨씬 많음

의도와 행동을 분리해서 측정·분석해야 한다.

직관 — 의도-행동 간극을 줄이는 도구

행동과학은 이 간극을 줄이는 여러 도구를 만들었다.

  • Implementation Intentions (“운동하겠다” → “월·수·금 7시 헬스장 간다”) — 구체화로 50% 행동 전환율 향상 (Gollwitzer 1999)
  • Default 옵션 — 의도가 약해도 행동 일어나도록 (장기 기증 사례)
  • Commitment Devices — 의도를 미리 묶어둠 (StickK 같은 서비스)

비즈니스 적용: “구매 의도 80%” 를 “구매 행동 80%” 로 바꾸려면 결제 단계의 friction 을 제거해야 한다.

2.4 4. Actions (실제 행동)

정의: Buisson 의 행동 변수 3 기준

Buisson 은 행동 변수가 다음 3 기준을 만족해야 한다고 한다.

  1. 관찰 가능 (observable) — 외부에서 측정할 수 있어야 함
  2. 개별적 (individual) — 한 개인의 행동으로 정의됨
  3. 원자적 (atomic) — 더 작은 행동으로 분해 안 되는 단위
직관 — “고객 참여(engagement)” 의 함정

“engagement” 는 비즈니스 분석에서 가장 자주 쓰이지만 가장 모호한 단어다. Buisson 은 두 의미가 섞여 있다고 지적한다.

  • 행동적 engagement: 클릭·페이지뷰·체류 시간 같은 관찰 가능한 행동
  • 감정적 engagement: “브랜드를 사랑한다” 같은 인지·감정 상태

이 둘이 분리되지 않으면:

  • “engagement 가 높다” 는 데이터를 보고 어떤 의미인지 모른 채 의사결정
  • “engagement 를 높이자” 는 목표가 행동 변수인지 인지 변수인지 모호

→ Buisson 의 권고: 변수를 5요소 모형의 어디에 매핑하는지 명시한다. 이게 곧 다음 §의 핵심 작업이다.

2.4.1 시간적 정보의 활용

행동 변수는 시간 차원에서 추가 정보를 가진다.

  • 빈도(frequency): 한 달에 몇 번 방문하는가
  • 지속시간(duration): 한 번에 얼마나 머무는가
  • 인접성(adjacency): 어떤 행동 직후 다른 행동이 일어나는가
직관 — 같은 “월 10회 방문” 도 의미가 다르다
패턴 분석적 의미
매주 2~3 회 균등 분포 안정적 습관 — 충성 고객
월말 1주일에 10회 몰빵 이벤트 기반 — 외부 트리거 의존
오전 9시에만 10회 출근길 루틴 — 위치·시간 제약
무작위 분포 비주기적 — 예측 어려움

같은 “월 10회” 라도 시간 차원의 인접성·빈도가 행동 분석을 풍부하게 만든다.

2.5 5. Business Behaviors (비즈니스 행동)

정의

기업·조직이 통제·결정 하는 모든 것. 광고, 가격, UX, 정책, 직원 매뉴얼, 알고리즘 등.

비즈니스 행동은 위 4 요소 (개인 특성·인지·의도·행동) 의 모든 단계에 영향을 미친다.

직관 — 미드라이프 크라이시스 사례

Buisson 의 그림 2-2 의 인과 사슬:

Personal: 40대 진입
    ↓
Cognition: 젊음을 다시 느끼고 싶음
    ↓
Intention: 빨간 콜벳을 사기로 결심
    ↓
Action: 콜벳 구매? 아니면 머리를 빨갛게 염색?

Business Behavior (모든 단계 영향):
"Youth is in your head" TV 광고 —
인지 단계에서 "젊음 = 마음가짐" 프레임 주입,
의도를 "콜벳 구매" 에서 "이미지 변신" 으로 redirect,
행동을 "머리 염색" 으로 전환

이 인과 사슬을 보면, 광고가 어디에 영향을 주는지에 따라 결과가 달라진다.

  • 광고가 의도 단계에 영향 → 빨간 콜벳 → 머리 염색 으로 행동 변경
  • 광고가 인지 단계에 영향 → 젊음의 정의 자체를 바꿈 → 다양한 행동 가능

→ 광고를 어느 단계 를 타겟으로 설계할지가 ROI 를 결정한다.

3 왜 필요한가 — 데이터 변수의 5요소 매핑이 곧 분석의 첫 단계

Buisson 의 핵심 메시지

데이터의 모든 변수를 5요소 (Personal/Cognition/Intentions/Actions/Business) 중 어디에 속하는지 매핑한다. 매핑이 안 되면 그 변수가 인과 사슬의 어디를 측정하는지 모르는 것이고, 인과 분석을 할 수 없다.

3.1 매핑이 잘못된 사례

“구독 해지율” 변수의 매핑 함정

“구독 해지율” 은 Action 인가 Cognition 인가?

  • Action 으로 매핑: 해지 버튼을 누른 행동의 비율 — 정의가 명확하지만 그 뒤의 동기가 안 보임
  • Cognition 으로 잘못 매핑: “고객의 불만족” 으로 해석 — 해지하지 않은 불만족 고객을 누락

올바른 분석:

  • Action: 해지 버튼 클릭 (binary)
  • Cognition: 만족도 점수 (continuous, 별도 변수로)
  • 두 변수를 분리 해서 인과 사슬을 봄. CSAT (Cognition) → Intention → Action 의 전환율을 분석.

3.2 “Behavioralize” — 모호한 변수를 행동 변수로 정제

Buisson 은 보통 변수가 처음에는 행동과 느슨한 관계 만 가진다고 한다. 이걸 명확한 행동 변수로 바꾸는 작업을 “behavioralize” 라 부른다.

직관 — “활성 사용자(active user)” 를 behavioralize 하기

“active user” 는 비즈니스에서 가장 흔한 변수지만 모호하다.

정의 후보 5요소 매핑 명료성
“지난 30일 내 1회 이상 로그인” Action — 로그인 행동 명확하지만 너무 약한 기준
“지난 30일 내 5회 이상 핵심 기능 사용” Action — 복합 행동 더 명확, 비즈니스 가치 반영
“유료 결제 후 구독 유지” Action — 결제 + Intention 두 단계 결합 — 분석 단계로 분리 권장

→ 가장 좋은 변수: 5요소 한 단계만 측정 하는 원자적 변수. 단계 결합은 인과 사슬을 잃는다.

4 Behavioral Integrity Mindset — 데이터를 의심하라

정의: Behavioral Integrity Mindset

Buisson 의 “Distrust and verify” 마인드셋. 어떤 변수든 그것이 측정한다고 주장하는 행동을 정말 측정하는지 의심하고, 데이터·외부 소스로 검증한다.

AirCnC 사례 (Buisson 의 두 번째 가상 회사)

가상 단기 임대 플랫폼 AirCnC 의 데이터 분석.

“고객 리뷰 평균 점수가 4.7” → “사용자가 만족” 으로 결론

함정:

  1. 선택 편향: 만족한 사용자가 리뷰 작성 확률 높음 → 표본이 만족 쪽으로 편향
  2. 5점 척도의 ceiling 효과: “5 - 1점” 의 의미 차이가 “3 - 1점” 보다 작음 → 평균이 4.7 이어도 분포는 양극화
  3. 시기적 편차: 최근 한 달 리뷰만이라면 트렌드 변화 못 잡음
  4. Bot/Fake 리뷰: 일부 플랫폼은 5~30% 가 가짜

Behavioral Integrity Mindset 적용:

  • “리뷰 점수 4.7 이 진짜 만족인가” 의심
  • 다른 행동 지표 (재예약률, 추천 행동) 와 교차 검증
  • “4.7” 의 신뢰 구간 + 표본 분포 점검

5 응용 분야 — 5요소 매핑의 실무 사례

비즈니스 영역 Personal Cognition Intention Action Business
이커머스 나이·소득·가구 구성 상품 선호·브랜드 인식 장바구니 담기 결제 광고·할인·UX
구독 서비스 직업·라이프스타일 만족도·불만 해지 의향·갱신 의향 해지·갱신·결제 가격·콘텐츠·CS
HR 학력·경력 직장 만족·burnout 이직 의도 이직·내부 이동 보상·교육·문화
금융 연령·재정 위험 선호 투자 의향 투자 실행 상품·프로모션·UX
헬스케어 만성 질환·BMI 건강 의식 운동 의도 운동 실행·약 복용 프로그램·코칭
직관 — 5요소 매핑이 분석을 어떻게 바꾸나

이커머스에서 “이탈 고객 분석” 을 한다고 하자.

기존 (5요소 매핑 없는) 접근:

“지난 30일 미방문 고객 10만 명 식별. 재마케팅 이메일 발송.”

5요소 매핑 후:

“Action 단계 (방문 안 함) 만 보면 안 됨. Intention (재구매 의향) 이 살아있는데 friction (Business behavior) 로 막혀있는지, Cognition (만족도) 자체가 떨어졌는지 분리. CSAT 설문으로 Cognition 확인 → 의도 살아있는 그룹에 friction 제거 캠페인, Cognition 떨어진 그룹에 재참여 캠페인.”

→ 같은 데이터, 다른 진단, 다른 처방. 매핑이 분석의 깊이를 바꾼다.

6 예시 — Buisson 의 미드라이프 크라이시스 사례 다시 보기

Personal Characteristics: 40대 진입
        ↓ (확률적 기여)
Cognition·Emotions: "젊음을 다시 느끼고 싶다" 의 욕망
        ↓
Intentions: 빨간 콜벳을 사겠다는 결심
        ↓
Actions: 콜벳 구매 OR 머리 염색 (대안)

Business Behaviors (회사가 통제):
- TV 광고 "Youth is in your head"
  → Cognition 단계에 영향: 젊음의 정의를 "마음가짐" 으로 reframe
  → Intention 단계에 영향: 콜벳 → 머리 염색 으로 행동 redirect
직관 — 광고 ROI 가 5요소에 따라 달라지는 이유

같은 광고비 예산 1억원 으로 다음 두 캠페인을 비교한다.

캠페인 A 캠페인 B
Action 단계 타겟 — “지금 사세요!” 직접 콜투액션 Cognition 단계 타겟 — “당신이 누구인지 보여주세요” 정체성 메시지
단기 판매율 ↑ (의도 있던 사람만 행동으로 전환) 장기 브랜드 인지 ↑ (인지 자체를 바꿈)
ROI 측정 쉬움 ROI 측정 어려움, 장기 효과

5요소 매핑이 없으면 이 차이를 모르고 두 캠페인을 같은 잣대로 평가한다.

7 코드 예시 — 데이터 변수의 5요소 매핑

import pandas as pd

# 가상 이커머스 고객 데이터
df = pd.DataFrame({
    "user_id": [1, 2, 3],
    "age": [25, 42, 35],                  # Personal
    "household_size": [1, 4, 2],           # Personal
    "csat_score": [4.5, 3.2, 4.8],         # Cognition
    "nps": [9, 5, 10],                     # Cognition
    "intent_to_repurchase": [True, False, True],  # Intention
    "actual_repurchase": [True, False, False],    # Action ← Intention 과 다름!
    "ad_exposure": [3, 0, 1],              # Business (회사 통제)
    "discount_applied": [10, 0, 5],        # Business
})

# 5요소 매핑 사전
variable_mapping = {
    "age": "Personal",
    "household_size": "Personal",
    "csat_score": "Cognition",
    "nps": "Cognition",
    "intent_to_repurchase": "Intention",
    "actual_repurchase": "Action",
    "ad_exposure": "Business",
    "discount_applied": "Business",
}

# 의도-행동 간극 분석
gap = (df["intent_to_repurchase"] != df["actual_repurchase"]).sum()
print(f"의도-행동 간극: {gap}/{len(df)} 고객 ({gap/len(df):.0%})")
print(f"  → User 3: 의도=True, 행동=False (의도가 행동으로 전환 안 됨)")

# 인과 사슬 분석 (간단한 예)
print("\n5요소별 변수 분포:")
for category in ["Personal", "Cognition", "Intention", "Action", "Business"]:
    vars_in_cat = [v for v, c in variable_mapping.items() if c == category]
    print(f"  {category}: {vars_in_cat}")
직관 — 이 코드의 의미

variable_mapping 사전은 단순해 보이지만, 이게 바로 행동 데이터 분석의 시작이다.

매핑 후 분석 가능한 질문:

  • Intention → Action 전환율 (의도-행동 간극)
  • Personal → Cognition 의 효과 (인구통계가 만족도에 미치는 영향)
  • Business → Action 의 효과 (광고가 실제 구매로 전환되는가) ← A/B 테스트 또는 인과 분석 영역

매핑 없이 통계만 돌리면 “변수 A 와 B 가 상관 0.6” 같은 표면 결과만 나온다. 매핑하면 “A 는 Cognition, B 는 Action 이므로 인과 사슬의 어느 단계 효과인지” 가 명확해진다.

8 코드 예시 — Buisson 의 행동 변수 3 기준 점검

def is_valid_behavioral_variable(name, definition):
    """Buisson 의 3 기준으로 행동 변수 평가."""
    checks = {
        "관찰 가능": "외부 측정 가능" in definition,
        "개별적": "한 사람" in definition or "개인" in definition,
        "원자적": "단일 행동" in definition,
    }
    return all(checks.values()), checks

# 변수 후보 평가
candidates = [
    ("active_user_v1", "지난 30일 1회 이상 로그인 한 사람"),
    ("engagement",     "사용자의 브랜드 충성도와 활동성 종합"),
    ("login_event",    "한 사람의 단일 로그인 행동 (외부 측정 가능)"),
]

for name, defn in candidates:
    valid, checks = is_valid_behavioral_variable(name, defn)
    print(f"\n{name}: {'PASS' if valid else 'FAIL'}")
    for criterion, ok in checks.items():
        print(f"  [{('O' if ok else 'X')}] {criterion}")
직관 — engagement 가 왜 항상 FAIL 인가

engagement 정의 “충성도와 활동성 종합” 은 세 기준 모두 위반:

  • 충성도: 인지·감정 (Cognition) — 직접 관찰 불가
  • 활동성: 여러 행동의 합 — 원자적이지 않음
  • “종합”: 여러 사람의 평균? 한 사람의 점수? 개별성 모호

→ engagement 변수는 분해가 필요하다. “월 로그인 횟수” + “유료 결제 횟수” + “추천 행동 횟수” 등 원자적 행동들로 나누고, 각각의 5요소 매핑을 한 후 종합한다.

9 관련 주제

9.1 Ch.2 의 sub-section 분해

9.2 이전 챕터

9.3 다음 챕터

9.5 카테고리 진입점

Subscribe

Enjoy this blog? Get notified of new posts by email: