1 정의
사람의 관찰 가능한 행동(actions) 과 그 행동의 인과 요인 을 담은 데이터다. 단순 “사용자 ID · 클릭 수” 같은 표면 변수가 아니라, 그 행동을 만든 더 깊은 모수 — 개인 특성, 인지·감정, 의도 — 를 함께 측정·추론하는 분석을 행동 데이터 분석(Behavioral Data Analysis) 이라 부른다 (Buisson, 2021, Ch.2).
Buisson 자신이 사용하는 비유다. 주인공이 세상을 볼 때 그 뒤의 숫자(코드)가 보이듯, 분석가가 데이터를 볼 때 그 뒤의 행동을 볼 수 있어야 한다.
“in this chapter you’ll learn to look at your data and see the behaviors behind it.”
데이터 = 표면. 행동 = 그 뒤의 진짜 작동 원리. 표면을 분석하면 표면적 결론밖에 못 낸다. 행동을 보아야 인과 분석이 가능하다.
2 개념 및 원리 — 인간 행동의 5 구성요소 모형
Buisson 은 책의 분석 단계를 위해 단순화된 행동 모형을 제안한다. 5 구성요소가 인과 사슬을 이룬다.
Personal Characteristics → Cognition·Emotions → Intentions → Actions
↑ ↑ ↑ ↑
└──────── Business Behaviors ────────────────┴──────────┘
비즈니스 행동(Business Behaviors) 은 분석가·기업이 통제 가능한 변수 — 광고, 가격, UX, 정책 — 로, 위 사슬의 모든 단계에 영향을 미친다.
2.1 1. Personal Characteristics (개인 특성)
분석 시간 frame 안에서 거의 변하지 않거나 매우 천천히 변하는 개인 정보. Buisson 은 이를 “primary causes” 로 정의한다 — 무한 회귀를 피하기 위해, 이 변수의 변화는 추적하지만 그 변화의 원인은 추적하지 않는다.
포함되는 것:
- 인구통계 (나이·성별·가족 구성)
- 성격 특질 (Big Five — 외향성·신경증 등)
- 생활 습관·라이프스타일
“성격이 구매를 일으킨다” 는 사회결정론처럼 들릴 수 있다. Buisson 의 답은 “확률적 기여 요인(probabilistic contributing factor)” 이다.
- 40대가 되었다 → 미드라이프 크라이시스의 필요조건도 충분조건도 아님
- 미드라이프 크라이시스 → 빨간 콜벳 구매의 필요조건도 충분조건도 아님
각 단계는 확률적 기여. “40대 → 더 높은 미드라이프 크라이시스 확률 → 더 높은 콜벳 구매 확률” 의 인과 사슬은 모든 사람에게 결정론적으로 작동하지 않지만, 집단 평균 으로 보면 의미있는 효과가 있다.
이 확률적 인과를 다루는 정확한 도구가 Hernan 정통 lens 의 잠재적 결과(potential outcomes) \(Y^a\) 표기 — Causal_Inference/02 에서 다룸.
2.1.1 인구통계 vs 더 깊은 모수
미국 (그리고 많은 국가) 에서 법 집행과 간호 직군은 여전히 성별로 강하게 구분된다. 이 데이터를 놓고:
- 표면 분석: “성별 → 직업” 인과 관계 — 흥미롭지도 실용적이지도 않음
- 깊은 분석: “성별 → 권위·돌봄에 대한 사회 표상·규범 → 직업” — 더 흥미롭고 실용적
인구통계 변수는 proxy 다. 진짜 인과 변수는 더 깊은 곳 (사회 표상, 역할 모델 부재, 자기 영속 기제) 에 있다.
비즈니스 의사결정에 활용하려면:
- “여성 고객은 X 를 구매한다” → “왜?” 까지 안 가면 캠페인 설계가 안 된다.
- “왜?” 의 답은 보통 인지·감정 단계에 있다 (다음 §).
2.2 2. Cognition and Emotions (인지·감정)
의식적·무의식적 사고와 감정 상태 — Buisson 은 이를 비즈니스 영역에서 다음과 매핑한다.
- 고객 만족도 (CSAT), 순추천지수 (NPS), 고객 경험 (CX) 같은 비즈니스 지표
- 행동과학·심리학에서의 동기·태도·신념
같은 “고객 경험” 을 두고도 분야마다 강조점이 다르다.
| 분야 | 강조 | 측정 도구 |
|---|---|---|
| UX 연구 | 사용자가 어떻게 느끼는가 (경험의 질) | 정성 인터뷰, 사용성 테스트, 만족도 |
| 행동과학 | 그 느낌이 어떻게 행동으로 전환되는가 (의도-행동 사슬) | 실험, 행동 추적, A/B 테스트 |
분석가는 두 관점을 연결하는 다리다. CSAT 가 90 점이라도 재구매 의도 가 낮으면 비즈니스 가치가 없다. CSAT (인지·감정) → 의도 → 행동의 사슬 전체를 봐야 한다.
2.3 3. Intentions (의도)
사람들이 “하겠다” 고 한 것과 실제 행동 사이의 차이. Buisson 은 이 간극을 분석가가 항상 의식해야 한다고 강조한다.
신년 결심 데이터를 보면:
- 운동 결심: 50% 의 사람이 “올해는 운동하겠다” 고 선언
- 6개월 후: 그 중 12% 만이 실제로 주 1회 이상 운동
의도 → 행동 의 전환율이 24%. 즉 의도 데이터로 행동을 예측하면 75% 의 사람이 “거짓말” 한 것처럼 보인다.
비즈니스 의사결정의 함의:
- 설문조사로 “이 신상품 사실 건가요?” 묻고 75% 가 “예” 답 → 실제 구매율은 20% 수준
- 연간 구독 환불 의사 조사 → 응답자보다 실제 환불자가 훨씬 많음
→ 의도와 행동을 분리해서 측정·분석해야 한다.
행동과학은 이 간극을 줄이는 여러 도구를 만들었다.
- Implementation Intentions (“운동하겠다” → “월·수·금 7시 헬스장 간다”) — 구체화로 50% 행동 전환율 향상 (Gollwitzer 1999)
- Default 옵션 — 의도가 약해도 행동 일어나도록 (장기 기증 사례)
- Commitment Devices — 의도를 미리 묶어둠 (StickK 같은 서비스)
비즈니스 적용: “구매 의도 80%” 를 “구매 행동 80%” 로 바꾸려면 결제 단계의 friction 을 제거해야 한다.
2.4 4. Actions (실제 행동)
Buisson 은 행동 변수가 다음 3 기준을 만족해야 한다고 한다.
- 관찰 가능 (observable) — 외부에서 측정할 수 있어야 함
- 개별적 (individual) — 한 개인의 행동으로 정의됨
- 원자적 (atomic) — 더 작은 행동으로 분해 안 되는 단위
“engagement” 는 비즈니스 분석에서 가장 자주 쓰이지만 가장 모호한 단어다. Buisson 은 두 의미가 섞여 있다고 지적한다.
- 행동적 engagement: 클릭·페이지뷰·체류 시간 같은 관찰 가능한 행동
- 감정적 engagement: “브랜드를 사랑한다” 같은 인지·감정 상태
이 둘이 분리되지 않으면:
- “engagement 가 높다” 는 데이터를 보고 어떤 의미인지 모른 채 의사결정
- “engagement 를 높이자” 는 목표가 행동 변수인지 인지 변수인지 모호
→ Buisson 의 권고: 변수를 5요소 모형의 어디에 매핑하는지 명시한다. 이게 곧 다음 §의 핵심 작업이다.
2.4.1 시간적 정보의 활용
행동 변수는 시간 차원에서 추가 정보를 가진다.
- 빈도(frequency): 한 달에 몇 번 방문하는가
- 지속시간(duration): 한 번에 얼마나 머무는가
- 인접성(adjacency): 어떤 행동 직후 다른 행동이 일어나는가
| 패턴 | 분석적 의미 |
|---|---|
| 매주 2~3 회 균등 분포 | 안정적 습관 — 충성 고객 |
| 월말 1주일에 10회 몰빵 | 이벤트 기반 — 외부 트리거 의존 |
| 오전 9시에만 10회 | 출근길 루틴 — 위치·시간 제약 |
| 무작위 분포 | 비주기적 — 예측 어려움 |
같은 “월 10회” 라도 시간 차원의 인접성·빈도가 행동 분석을 풍부하게 만든다.
2.5 5. Business Behaviors (비즈니스 행동)
기업·조직이 통제·결정 하는 모든 것. 광고, 가격, UX, 정책, 직원 매뉴얼, 알고리즘 등.
비즈니스 행동은 위 4 요소 (개인 특성·인지·의도·행동) 의 모든 단계에 영향을 미친다.
Buisson 의 그림 2-2 의 인과 사슬:
Personal: 40대 진입
↓
Cognition: 젊음을 다시 느끼고 싶음
↓
Intention: 빨간 콜벳을 사기로 결심
↓
Action: 콜벳 구매? 아니면 머리를 빨갛게 염색?
Business Behavior (모든 단계 영향):
"Youth is in your head" TV 광고 —
인지 단계에서 "젊음 = 마음가짐" 프레임 주입,
의도를 "콜벳 구매" 에서 "이미지 변신" 으로 redirect,
행동을 "머리 염색" 으로 전환
이 인과 사슬을 보면, 광고가 어디에 영향을 주는지에 따라 결과가 달라진다.
- 광고가 의도 단계에 영향 → 빨간 콜벳 → 머리 염색 으로 행동 변경
- 광고가 인지 단계에 영향 → 젊음의 정의 자체를 바꿈 → 다양한 행동 가능
→ 광고를 어느 단계 를 타겟으로 설계할지가 ROI 를 결정한다.
3 왜 필요한가 — 데이터 변수의 5요소 매핑이 곧 분석의 첫 단계
데이터의 모든 변수를 5요소 (Personal/Cognition/Intentions/Actions/Business) 중 어디에 속하는지 매핑한다. 매핑이 안 되면 그 변수가 인과 사슬의 어디를 측정하는지 모르는 것이고, 인과 분석을 할 수 없다.
3.1 매핑이 잘못된 사례
“구독 해지율” 은 Action 인가 Cognition 인가?
- Action 으로 매핑: 해지 버튼을 누른 행동의 비율 — 정의가 명확하지만 그 뒤의 동기가 안 보임
- Cognition 으로 잘못 매핑: “고객의 불만족” 으로 해석 — 해지하지 않은 불만족 고객을 누락
올바른 분석:
- Action: 해지 버튼 클릭 (binary)
- Cognition: 만족도 점수 (continuous, 별도 변수로)
- 두 변수를 분리 해서 인과 사슬을 봄. CSAT (Cognition) → Intention → Action 의 전환율을 분석.
3.2 “Behavioralize” — 모호한 변수를 행동 변수로 정제
Buisson 은 보통 변수가 처음에는 행동과 느슨한 관계 만 가진다고 한다. 이걸 명확한 행동 변수로 바꾸는 작업을 “behavioralize” 라 부른다.
“active user” 는 비즈니스에서 가장 흔한 변수지만 모호하다.
| 정의 후보 | 5요소 매핑 | 명료성 |
|---|---|---|
| “지난 30일 내 1회 이상 로그인” | Action — 로그인 행동 | 명확하지만 너무 약한 기준 |
| “지난 30일 내 5회 이상 핵심 기능 사용” | Action — 복합 행동 | 더 명확, 비즈니스 가치 반영 |
| “유료 결제 후 구독 유지” | Action — 결제 + Intention | 두 단계 결합 — 분석 단계로 분리 권장 |
→ 가장 좋은 변수: 5요소 한 단계만 측정 하는 원자적 변수. 단계 결합은 인과 사슬을 잃는다.
4 Behavioral Integrity Mindset — 데이터를 의심하라
Buisson 의 “Distrust and verify” 마인드셋. 어떤 변수든 그것이 측정한다고 주장하는 행동을 정말 측정하는지 의심하고, 데이터·외부 소스로 검증한다.
가상 단기 임대 플랫폼 AirCnC 의 데이터 분석.
“고객 리뷰 평균 점수가 4.7” → “사용자가 만족” 으로 결론
함정:
- 선택 편향: 만족한 사용자가 리뷰 작성 확률 높음 → 표본이 만족 쪽으로 편향
- 5점 척도의 ceiling 효과: “5 - 1점” 의 의미 차이가 “3 - 1점” 보다 작음 → 평균이 4.7 이어도 분포는 양극화
- 시기적 편차: 최근 한 달 리뷰만이라면 트렌드 변화 못 잡음
- Bot/Fake 리뷰: 일부 플랫폼은 5~30% 가 가짜
Behavioral Integrity Mindset 적용:
- “리뷰 점수 4.7 이 진짜 만족인가” 의심
- 다른 행동 지표 (재예약률, 추천 행동) 와 교차 검증
- “4.7” 의 신뢰 구간 + 표본 분포 점검
5 응용 분야 — 5요소 매핑의 실무 사례
| 비즈니스 영역 | Personal | Cognition | Intention | Action | Business |
|---|---|---|---|---|---|
| 이커머스 | 나이·소득·가구 구성 | 상품 선호·브랜드 인식 | 장바구니 담기 | 결제 | 광고·할인·UX |
| 구독 서비스 | 직업·라이프스타일 | 만족도·불만 | 해지 의향·갱신 의향 | 해지·갱신·결제 | 가격·콘텐츠·CS |
| HR | 학력·경력 | 직장 만족·burnout | 이직 의도 | 이직·내부 이동 | 보상·교육·문화 |
| 금융 | 연령·재정 | 위험 선호 | 투자 의향 | 투자 실행 | 상품·프로모션·UX |
| 헬스케어 | 만성 질환·BMI | 건강 의식 | 운동 의도 | 운동 실행·약 복용 | 프로그램·코칭 |
이커머스에서 “이탈 고객 분석” 을 한다고 하자.
기존 (5요소 매핑 없는) 접근:
“지난 30일 미방문 고객 10만 명 식별. 재마케팅 이메일 발송.”
5요소 매핑 후:
“Action 단계 (방문 안 함) 만 보면 안 됨. Intention (재구매 의향) 이 살아있는데 friction (Business behavior) 로 막혀있는지, Cognition (만족도) 자체가 떨어졌는지 분리. CSAT 설문으로 Cognition 확인 → 의도 살아있는 그룹에 friction 제거 캠페인, Cognition 떨어진 그룹에 재참여 캠페인.”
→ 같은 데이터, 다른 진단, 다른 처방. 매핑이 분석의 깊이를 바꾼다.
6 예시 — Buisson 의 미드라이프 크라이시스 사례 다시 보기
Personal Characteristics: 40대 진입
↓ (확률적 기여)
Cognition·Emotions: "젊음을 다시 느끼고 싶다" 의 욕망
↓
Intentions: 빨간 콜벳을 사겠다는 결심
↓
Actions: 콜벳 구매 OR 머리 염색 (대안)
Business Behaviors (회사가 통제):
- TV 광고 "Youth is in your head"
→ Cognition 단계에 영향: 젊음의 정의를 "마음가짐" 으로 reframe
→ Intention 단계에 영향: 콜벳 → 머리 염색 으로 행동 redirect
같은 광고비 예산 1억원 으로 다음 두 캠페인을 비교한다.
| 캠페인 A | 캠페인 B |
|---|---|
| Action 단계 타겟 — “지금 사세요!” 직접 콜투액션 | Cognition 단계 타겟 — “당신이 누구인지 보여주세요” 정체성 메시지 |
| 단기 판매율 ↑ (의도 있던 사람만 행동으로 전환) | 장기 브랜드 인지 ↑ (인지 자체를 바꿈) |
| ROI 측정 쉬움 | ROI 측정 어려움, 장기 효과 |
5요소 매핑이 없으면 이 차이를 모르고 두 캠페인을 같은 잣대로 평가한다.
7 코드 예시 — 데이터 변수의 5요소 매핑
import pandas as pd
# 가상 이커머스 고객 데이터
df = pd.DataFrame({
"user_id": [1, 2, 3],
"age": [25, 42, 35], # Personal
"household_size": [1, 4, 2], # Personal
"csat_score": [4.5, 3.2, 4.8], # Cognition
"nps": [9, 5, 10], # Cognition
"intent_to_repurchase": [True, False, True], # Intention
"actual_repurchase": [True, False, False], # Action ← Intention 과 다름!
"ad_exposure": [3, 0, 1], # Business (회사 통제)
"discount_applied": [10, 0, 5], # Business
})
# 5요소 매핑 사전
variable_mapping = {
"age": "Personal",
"household_size": "Personal",
"csat_score": "Cognition",
"nps": "Cognition",
"intent_to_repurchase": "Intention",
"actual_repurchase": "Action",
"ad_exposure": "Business",
"discount_applied": "Business",
}
# 의도-행동 간극 분석
gap = (df["intent_to_repurchase"] != df["actual_repurchase"]).sum()
print(f"의도-행동 간극: {gap}/{len(df)} 고객 ({gap/len(df):.0%})")
print(f" → User 3: 의도=True, 행동=False (의도가 행동으로 전환 안 됨)")
# 인과 사슬 분석 (간단한 예)
print("\n5요소별 변수 분포:")
for category in ["Personal", "Cognition", "Intention", "Action", "Business"]:
vars_in_cat = [v for v, c in variable_mapping.items() if c == category]
print(f" {category}: {vars_in_cat}")variable_mapping 사전은 단순해 보이지만, 이게 바로 행동 데이터 분석의 시작이다.
매핑 후 분석 가능한 질문:
- Intention → Action 전환율 (의도-행동 간극)
- Personal → Cognition 의 효과 (인구통계가 만족도에 미치는 영향)
- Business → Action 의 효과 (광고가 실제 구매로 전환되는가) ← A/B 테스트 또는 인과 분석 영역
매핑 없이 통계만 돌리면 “변수 A 와 B 가 상관 0.6” 같은 표면 결과만 나온다. 매핑하면 “A 는 Cognition, B 는 Action 이므로 인과 사슬의 어느 단계 효과인지” 가 명확해진다.
8 코드 예시 — Buisson 의 행동 변수 3 기준 점검
def is_valid_behavioral_variable(name, definition):
"""Buisson 의 3 기준으로 행동 변수 평가."""
checks = {
"관찰 가능": "외부 측정 가능" in definition,
"개별적": "한 사람" in definition or "개인" in definition,
"원자적": "단일 행동" in definition,
}
return all(checks.values()), checks
# 변수 후보 평가
candidates = [
("active_user_v1", "지난 30일 1회 이상 로그인 한 사람"),
("engagement", "사용자의 브랜드 충성도와 활동성 종합"),
("login_event", "한 사람의 단일 로그인 행동 (외부 측정 가능)"),
]
for name, defn in candidates:
valid, checks = is_valid_behavioral_variable(name, defn)
print(f"\n{name}: {'PASS' if valid else 'FAIL'}")
for criterion, ok in checks.items():
print(f" [{('O' if ok else 'X')}] {criterion}")engagement 정의 “충성도와 활동성 종합” 은 세 기준 모두 위반:
- 충성도: 인지·감정 (Cognition) — 직접 관찰 불가
- 활동성: 여러 행동의 합 — 원자적이지 않음
- “종합”: 여러 사람의 평균? 한 사람의 점수? 개별성 모호
→ engagement 변수는 분해가 필요하다. “월 로그인 횟수” + “유료 결제 횟수” + “추천 행동 횟수” 등 원자적 행동들로 나누고, 각각의 5요소 매핑을 한 후 종합한다.
9 관련 주제
9.1 Ch.2 의 sub-section 분해
- E-BUI2-1 인간 행동 5 구성요소 — Personal/Cognition/Intentions/Actions/Business 각각 자세히
- E-BUI2-2 행동·데이터 연결 — 데이터 변수의 5요소 매핑 절차
- E-BUI2-3 행동적 무결성 마인드셋 — Distrust and Verify
9.2 이전 챕터
9.3 다음 챕터
- E-BUI3-0 인과 다이어그램 도입 — Buisson Ch.3
- E-BUI11-0 Moderation overview — 5요소 매핑 후 인과 분석의 실무 적용
9.4 Hernan 정통 cross-link
- Causal_Inference/02 인과 효과의 정의와 잠재 결과 — 5요소 모형의 학술적 base (\(Y^a\) 표기)
- Causal_Inference/04 효과 수정 — Personal Characteristics 가 처치 효과를 modify 하는 모형
9.5 카테고리 진입점
- Experimentation 학습 로드맵 — 11 Phase × 7 교재 매핑