점 하나로 ‘지금이다’를 말할 수 있을까?
들어가며
구매의사 방향 벡터를 만들었다면, 다음 질문은 아주 현실적이다.
“그래서 어디까지 오면 ‘구매 직전’이라고 볼 수 있지?”
이 질문에 답하는 것이 바로 임계값(threshold) 설계다.
임계값은 추천·푸시·혜택·상담 연결의 트리거가 된다.
한 문장 요약
구매 직전 임계값이란,
구매의사 스코어가 ‘행동으로 전환될 확률이 급격히 높아지는 지점’이다.
1. 먼저 정리: 우리가 가진 것
- 고객 임베딩 v
- 구매의사 방향 벡터 axis_purchase
- 구매의사 스코어
score = dot(v, axis_purchase)이제 할 일은 이 score의 어디가 ‘직전’인지를 찾는 것.
2. 임계값은 ‘고정 숫자’가 아니다
(X) 0.5 넘으면 구매 직전
(X) 상위 10%면 구매 직전
이런 규칙은 초기 가설로는 쓸 수 있어도,
운영 임계값으로는 위험하다.
→ 임계값은 분포와 결과를 함께 보며 정해진다.
3. 방법 1: 구매 발생 확률 곡선으로 찾기 (가장 정석)
Step 1. 스코어 구간화
- 구매의사 스코어를 구간(bin)으로 나눈다.
[-2.0~-1.5], [-1.5~-1.0], ..., [1.5~2.0]Step 2. 구간별 구매율 계산
- 각 구간에서 실제 구매 발생 비율을 계산
Step 3. ‘급격한 기울기 변화점’ 찾기
- 구매율이 완만 → 급증으로 바뀌는 지점
- 이 지점이 구매 직전 임계값 후보
→ 확률이 ‘튀는’ 지점이 핵심
4.방법 2: Precision–Recall 기반 임계값 (운영 친화적)
구매 직전 타겟팅은 보통 이 고민을 한다.
- 너무 낮으면 → 오탐(낭비)
- 너무 높으면 → 미탐(기회 손실)
절차
- 임계값 후보들을 순회
- 각 임계값에서:
- Precision (정확도)
- Recall (포착률)
- 비즈니스 비용 함수로 최적점 선택
예:
Cost = (오탐 비용 × FP) + (미탐 비용 × FN)→ 모델이 아니라 비즈니스가 정하는 임계값
5. 방법 3: 시간 기반 검증 (가장 중요한 안정성 체크)
진짜 “구매 직전”이라면 이 특징이 있어야 한다.
임계값을 넘긴 후
짧은 시간 내 구매가 발생한다
체크 방법
- 고객이 임계값을 처음 넘긴 시점
- 이후 T일 내 구매 발생 여부
→ 임계값 이후 구매까지의 시간이 짧을수록 임계값이 ‘직전’에 가깝다
6.방법 4: 다중 임계값 (실무에서 가장 많이 씀)
현실은 이진이 아니다.
그래서 임계값도 단계형이 좋다.
예시
|
스코어 구간 |
상태 |
액션 |
|---|---|---|
|
< T1 |
탐색 |
관찰 |
|
T1 ~ T2 |
관심 |
콘텐츠 추천 |
|
T2 ~ T3 |
구매 직전 |
혜택/푸시 |
|
≥ T3 |
매우 높음 |
즉시 전환 유도 |
→ 한 줄의 숫자보다, 상태 머신이 강력하다
7. 임계값이 잘 잡혔는지 확인하는 체크리스트
- 임계값 상단 고객의 실제 행동이 ‘직전’인가?
- 시간 흐름에서 스코어가 자연스럽게 상승하는가?
- 임계값을 자주 넘었다 내려갔다 하지 않는가?
- 캠페인 투입 시 전환율이 유의미하게 증가하는가?
8.흔한 실패 패턴
(X) 학습 데이터 분포만 보고 임계값 고정
(X) 카테고리/상품 특성 무시
(X) 시즌성·프로모션 효과 미반영
(X) 단일 숫자에 과도한 의미 부여
→ 임계값은 ‘살아 있는 규칙’이다
9. 운영 팁: 임계값을 더 똑똑하게 쓰는 법
- 상품군별 임계값(고가 vs 저가)
- 채널별 임계값(앱 vs 웹)
- 고객군별 임계값(신규 vs 기존)
→ 구매의사는 상대적이다.
한 문장으로 정리하면
구매 직전 임계값이란
숫자 하나가 아니라
‘전환 확률이 급변하는 지점’이다.
마치며
구매의사 방향 벡터는
“어느 방향으로 가고 있는가”를 알려준다.
임계값은 그 위에서 묻는 질문이다.
- 지금인가?
- 조금 더 기다릴까?
- 개입할 타이밍인가?
이 둘이 만나는 순간,
추천과 마케팅은 운이 아니라 설계가 된다.