점 하나로 ‘지금이다’를 말할 수 있을까?


들어가며

구매의사 방향 벡터를 만들었다면, 다음 질문은 아주 현실적이다.

“그래서 어디까지 오면 ‘구매 직전’이라고 볼 수 있지?

이 질문에 답하는 것이 바로 임계값(threshold) 설계다.

임계값은 추천·푸시·혜택·상담 연결의 트리거가 된다.


한 문장 요약

구매 직전 임계값이란,
구매의사 스코어가 ‘행동으로 전환될 확률이 급격히 높아지는 지점’이다.


1. 먼저 정리: 우리가 가진 것

  • 고객 임베딩 v
  • 구매의사 방향 벡터 axis_purchase
  • 구매의사 스코어
score = dot(v, axis_purchase)

이제 할 일은 이 score의 어디가 ‘직전’인지를 찾는 것.


2. 임계값은 ‘고정 숫자’가 아니다

(X) 0.5 넘으면 구매 직전

(X) 상위 10%면 구매 직전

이런 규칙은 초기 가설로는 쓸 수 있어도,

운영 임계값으로는 위험하다.

→ 임계값은 분포와 결과를 함께 보며 정해진다.


3. 방법 1: 구매 발생 확률 곡선으로 찾기 (가장 정석)

Step 1. 스코어 구간화

  • 구매의사 스코어를 구간(bin)으로 나눈다.
[-2.0~-1.5], [-1.5~-1.0], ..., [1.5~2.0]

Step 2. 구간별 구매율 계산

  • 각 구간에서 실제 구매 발생 비율을 계산

Step 3. ‘급격한 기울기 변화점’ 찾기

  • 구매율이 완만 → 급증으로 바뀌는 지점
  • 이 지점이 구매 직전 임계값 후보

확률이 ‘튀는’ 지점이 핵심


4.방법 2: Precision–Recall 기반 임계값 (운영 친화적)

구매 직전 타겟팅은 보통 이 고민을 한다.

  • 너무 낮으면 → 오탐(낭비)
  • 너무 높으면 → 미탐(기회 손실)

절차

  1. 임계값 후보들을 순회
  2. 각 임계값에서:
    • Precision (정확도)
    • Recall (포착률)
  3. 비즈니스 비용 함수로 최적점 선택

예:

Cost = (오탐 비용 × FP) + (미탐 비용 × FN)

모델이 아니라 비즈니스가 정하는 임계값


5. 방법 3: 시간 기반 검증 (가장 중요한 안정성 체크)

진짜 “구매 직전”이라면 이 특징이 있어야 한다.

임계값을 넘긴 후
짧은 시간 내 구매가 발생한다

체크 방법

  • 고객이 임계값을 처음 넘긴 시점
  • 이후 T일 내 구매 발생 여부

임계값 이후 구매까지의 시간이 짧을수록 임계값이 ‘직전’에 가깝다


6.방법 4: 다중 임계값 (실무에서 가장 많이 씀)

현실은 이진이 아니다.

그래서 임계값도 단계형이 좋다.

예시

스코어 구간

상태

액션

< T1

탐색

관찰

T1 ~ T2

관심

콘텐츠 추천

T2 ~ T3

구매 직전

혜택/푸시

≥ T3

매우 높음

즉시 전환 유도

한 줄의 숫자보다, 상태 머신이 강력하다


7. 임계값이 잘 잡혔는지 확인하는 체크리스트

  • 임계값 상단 고객의 실제 행동이 ‘직전’인가?
  • 시간 흐름에서 스코어가 자연스럽게 상승하는가?
  • 임계값을 자주 넘었다 내려갔다 하지 않는가?
  • 캠페인 투입 시 전환율이 유의미하게 증가하는가?


8.흔한 실패 패턴

(X) 학습 데이터 분포만 보고 임계값 고정

(X) 카테고리/상품 특성 무시

(X) 시즌성·프로모션 효과 미반영

(X) 단일 숫자에 과도한 의미 부여

임계값은 ‘살아 있는 규칙’이다


9. 운영 팁: 임계값을 더 똑똑하게 쓰는 법

  • 상품군별 임계값(고가 vs 저가)
  • 채널별 임계값(앱 vs 웹)
  • 고객군별 임계값(신규 vs 기존)

→ 구매의사는 상대적이다.


한 문장으로 정리하면

구매 직전 임계값이란
숫자 하나가 아니라
‘전환 확률이 급변하는 지점’이다.

마치며

구매의사 방향 벡터는

“어느 방향으로 가고 있는가”를 알려준다.

임계값은 그 위에서 묻는 질문이다.

  • 지금인가?
  • 조금 더 기다릴까?
  • 개입할 타이밍인가?

이 둘이 만나는 순간,

추천과 마케팅은 운이 아니라 설계가 된다.

[Embedding] 18. 구매의사 방향 벡터로 “구매 직전 임계값” 찾기