점 하나로 ‘지금이다’를 말할 수 있을까?

들어가며

구매의사 방향 벡터를 만들었다면, 다음 질문은 아주 현실적이다.

“그래서 어디까지 오면 ‘구매 직전’이라고 볼 수 있지?”

이 질문에 답하는 것이 바로 임계값(threshold) 설계다.

임계값은 추천·푸시·혜택·상담 연결의 트리거가 된다.

한 문장 요약

구매 직전 임계값이란,

구매의사 스코어가 ‘행동으로 전환될 확률이 급격히 높아지는 지점’이다.

1. 먼저 정리: 우리가 가진 것

고객 임베딩 v
구매의사 방향 벡터 axis_purchase
구매의사 스코어

score = dot(v, axis_purchase)

이제 할 일은 이 score의 어디가 ‘직전’인지를 찾는 것.

2. 임계값은 ‘고정 숫자’가 아니다

(X) 0.5 넘으면 구매 직전

(X) 상위 10%면 구매 직전

이런 규칙은 초기 가설로는 쓸 수 있어도,

운영 임계값으로는 위험하다.

→ 임계값은 분포와 결과를 함께 보며 정해진다.

3. 방법 1: 구매 발생 확률 곡선으로 찾기 (가장 정석)

Step 1. 스코어 구간화

구매의사 스코어를 구간(bin)으로 나눈다.

[-2.0~-1.5], [-1.5~-1.0], ..., [1.5~2.0]

Step 2. 구간별 구매율 계산

각 구간에서 실제 구매 발생 비율을 계산

Step 3. ‘급격한 기울기 변화점’ 찾기

구매율이 완만 → 급증으로 바뀌는 지점
이 지점이 구매 직전 임계값 후보

→ 확률이 ‘튀는’ 지점이 핵심

4.방법 2: Precision–Recall 기반 임계값 (운영 친화적)

구매 직전 타겟팅은 보통 이 고민을 한다.

너무 낮으면 → 오탐(낭비)
너무 높으면 → 미탐(기회 손실)

절차

임계값 후보들을 순회
각 임계값에서:
- Precision (정확도)
- Recall (포착률)
비즈니스 비용 함수로 최적점 선택

예:

Cost = (오탐 비용 × FP) + (미탐 비용 × FN)

→ 모델이 아니라 비즈니스가 정하는 임계값

5. 방법 3: 시간 기반 검증 (가장 중요한 안정성 체크)

진짜 “구매 직전”이라면 이 특징이 있어야 한다.

임계값을 넘긴 후

짧은 시간 내 구매가 발생한다

체크 방법

고객이 임계값을 처음 넘긴 시점
이후 T일 내 구매 발생 여부

→ 임계값 이후 구매까지의 시간이 짧을수록 임계값이 ‘직전’에 가깝다

6.방법 4: 다중 임계값 (실무에서 가장 많이 씀)

현실은 이진이 아니다.

그래서 임계값도 단계형이 좋다.

예시

스코어 구간	상태	액션
< T1	탐색	관찰
T1 ~ T2	관심	콘텐츠 추천
T2 ~ T3	구매 직전	혜택/푸시
≥ T3	매우 높음	즉시 전환 유도

→ 한 줄의 숫자보다, 상태 머신이 강력하다

7. 임계값이 잘 잡혔는지 확인하는 체크리스트

임계값 상단 고객의 실제 행동이 ‘직전’인가?
시간 흐름에서 스코어가 자연스럽게 상승하는가?
임계값을 자주 넘었다 내려갔다 하지 않는가?
캠페인 투입 시 전환율이 유의미하게 증가하는가?

8.흔한 실패 패턴

(X) 학습 데이터 분포만 보고 임계값 고정

(X) 카테고리/상품 특성 무시

(X) 시즌성·프로모션 효과 미반영

(X) 단일 숫자에 과도한 의미 부여

→ 임계값은 ‘살아 있는 규칙’이다

9. 운영 팁: 임계값을 더 똑똑하게 쓰는 법

상품군별 임계값(고가 vs 저가)
채널별 임계값(앱 vs 웹)
고객군별 임계값(신규 vs 기존)

→ 구매의사는 상대적이다.

한 문장으로 정리하면

구매 직전 임계값이란

숫자 하나가 아니라

‘전환 확률이 급변하는 지점’이다.

마치며

구매의사 방향 벡터는

“어느 방향으로 가고 있는가”를 알려준다.

임계값은 그 위에서 묻는 질문이다.

지금인가?
조금 더 기다릴까?
개입할 타이밍인가?

이 둘이 만나는 순간,

추천과 마케팅은 운이 아니라 설계가 된다.

[Embedding] 18. 구매의사 방향 벡터로 “구매 직전 임계값” 찾기