2 điểm bởi GN⁺ 2025-06-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Banner trang chủ là khu vực cốt lõi xuất hiện đầu tiên trên màn hình đầu tiên của khách hàng, và thông qua hệ thống gợi ý siêu cá nhân hóa, tỷ lệ nhấp (CTR) cùng trải nghiệm người dùng được tối đa hóa
  • Thoát khỏi cách tối ưu CTR đơn giản trước đây dựa trên MAB (multi-armed bandit), hệ thống phản ánh tinh vi đặc tính của banner và người dùng bằng các thuật toán hiện đại như DeepFM, Two-Tower, HGNN cùng embedding dựa trên đồ thị
  • Các vấn đề đặc thù của miền như vòng đời banner ngắn, tín hiệu phản hồi click nhiều nhiễu, mất cân bằng dữ liệu được giải quyết bằng Continual Learning và cách vận hành kết hợp mô hình riêng lẻ với mô hình tích hợp
  • Cuối cùng, hệ thống xây dựng được một pipeline gợi ý bài bản với CTR tăng hơn 16%, khả năng xử lý banner mới và người dùng cold-start, cùng liên kết với thời gian thực và chính sách kinh doanh
  • Trong tương lai, hệ thống sẽ tiếp tục được nâng cấp theo các hướng như phục vụ thời gian thực, Multi-Task Learning, nâng cao chất lượng embedding, đưa vào các chỉ số hiệu quả đa chiều

Tạo trải nghiệm tốt hơn bằng big banner phù hợp với từng khách hàng

  • Khi gu của khách hàng và độ đa dạng của nội dung hiển thị tăng lên, việc hiển thị banner đồng loạt bộc lộ giới hạn trong việc mang lại trải nghiệm thỏa đáng
  • Với mục tiêu tối đa hóa CTR, Musinsa đã triển khai dự án đưa logic hiển thị cá nhân hóa vào big banner ở phía trên cùng trang chủ của từng store

Tầm quan trọng và đặc điểm của banner trang chủ

  • Banner trang chủ là banner dạng slide ở trên cùng màn hình mà khách hàng nhìn thấy đầu tiên trong dịch vụ Musinsa (tổng cộng 35 banner); trên app hiển thị một banner, còn trên web hiển thị ba banner
  • Khoảng 97% lưu lượng truy cập toàn bộ Musinsa sẽ nhìn thấy banner trang chủ khi vào màn hình chính
  • Số lượt nhấp vào banner trang chủ chiếm 35% tổng số click và tới 37% các phiên có phát sinh click, cho thấy tỷ trọng rất lớn
  • Đây là khu vực có tác động chuyển đổi kinh doanh rất lớn nhờ tần suất hiển thị cao

Giới hạn của phương thức gợi ý cũ

  • Trước đây, hệ thống sử dụng thuật toán MAB (Multi-Armed Bandit) để gợi ý tập trung vào CTR
    • Cân bằng giữa khám phá (Exploration)khai thác (Exploitation)
  • Ba giới hạn chính:
    • Phụ thuộc vào một chỉ số click-through rate duy nhất, nên chưa phản ánh tốt các sở thích đa dạng của khách hàng và đặc tính của banner
    • Khó phản ánh mối liên quan giữa các banner (do xử lý độc lập)
    • Cold start (hiệu năng suy giảm khi banner mới thiếu dữ liệu click)
  • Để vượt qua các giới hạn này, Musinsa đã thiết kế một hệ thống gợi ý mới

Pipeline của hệ thống gợi ý

  • Hệ thống được cấu thành theo pipeline nhiều tầng
    1. Tăng cường representation của banner: trích xuất embedding dựa trên văn bản, hình ảnh và sản phẩm liên quan tới banner (sử dụng HGNN, GraphSAGE)
    2. Huấn luyện mô hình dự đoán click: đồng thời áp dụng DeepFM (tương tác đặc trưng) và Two-Tower (embedding tách biệt người dùng/banner)
    3. Chấm điểm và áp dụng cho banner: tính điểm dự đoán CTR theo người dùng bằng batch/thời gian thực
      • Với người dùng có đủ dữ liệu, áp dụng cá nhân hóa tinh vi
      • Với người dùng mới hoặc cold user, áp dụng gợi ý dựa trên phân khúc
    4. Phản ánh chính sách kinh doanh: ngoài điểm do hệ thống tính, còn phản ánh theo thời gian thực các chính sách và chiến lược công ty, banner chiến dịch, thay đổi khẩn cấp
    5. Hiển thị banner cuối cùng: gợi ý và hiển thị Top-N banner có điểm cao nhất

Giới thiệu các mô hình cốt lõi của hệ thống gợi ý

  • DeepFM: cấu trúc song song giữa FM (tương tác bậc hai) + DNN (tương tác bậc cao), học hiệu quả cả dữ liệu thưa lẫn tương tác phức tạp, rất phù hợp cho dự đoán CTR
  • Two-Tower: trích xuất embedding của người dùng và banner từ các mạng nơ-ron độc lập, mạnh ở dữ liệu quy mô lớn và phục vụ thời gian thực, gợi ý dựa trên độ tương đồng

DeepFM

  • Kết hợp lớp FM (tương tác đặc trưng bậc hai) + lớp DNN (tích hợp đặc trưng phi tuyến bậc cao)
  • Mạnh với dữ liệu thưa, đồng thời tối ưu hiệu năng nhất quán nhờ cấu trúc học End-to-End
  • Sử dụng thông tin người dùng, metadata của banner và thông tin embedding (64 chiều) làm đặc trưng
  • Xử lý vector embedding như một khối đơn nhất để đảm bảo hiệu quả và độ ổn định khi huấn luyện
  • Tạo thứ hạng banner từ kết quả dự đoán CTR

Two-Tower

  • Người dùng và banner được embedding trong các mạng nơ-ron riêng biệt (tower), sau đó tính độ tương đồng
  • khả năng mở rộng phù hợp với dữ liệu quy mô lớn, đồng thời cho phép phản hồi nhanh nhờ vector hóa trước (độ trễ thấp)
  • Mỗi tower sử dụng nhiều loại đầu vào như nhân khẩu học, log hành vi, văn bản/hình ảnh
  • Cấu trúc tách biệt huấn luyện/xử lý song song giúp ứng phó nhanh và linh hoạt với các bài toán gợi ý quy mô lớn

Những khó khăn chính khi áp dụng vào thực tế

  • Banner trang chủ có vòng đời rất ngắn (2~3 ngày, thậm chí tính theo vài giờ), nên cần phản ánh theo thời gian thực
  • Tín hiệu phản hồi chủ yếu dựa vào click, nên khó phân biệt sở thích thực sự của người dùng
  • Khác với sản phẩm hay thương hiệu, banner thiếu metadata được chuẩn hóa, nên khó nắm bắt ngữ cảnh từ hình ảnh, văn bản
  • Mất cân bằng dữ liệu theo từng store (khác biệt về traffic và mức độ hoạt động giữa các chuyên trang) có thể làm suy giảm hiệu năng tổng thể
  • Để vượt qua các vấn đề này, hệ thống được thiết kế lại xoay quanh ba trục công nghệ: tăng cường khả năng biểu diễn, duy trì tính mới, và giảm mất cân bằng

Các biện pháp cải thiện thực chất

Tăng cường đặc tính banner

  • Để vượt qua giới hạn của việc dùng trung bình embedding PinSAGE (khó biểu diễn banner phức hợp, không thể gợi ý banner mới), Musinsa đã đưa vào HGNN
  • Dựa trên mẫu hành vi của người dùng, quan hệ banner-sản phẩm trong cấu trúc đồ thị được embedding bằng GraphSAGE
  • Với thông tin văn bản và hình ảnh, hệ thống dùng tổ hợp embedding từ LLM
  • Cập nhật embedding người dùng theo thời gian thực và áp dụng Continual Learning để phản ánh mối quan tâm mới nhất của người dùng
  • CTR tăng 8,3%

Continual Learning

  • Thay vì huấn luyện toàn bộ dữ liệu theo lô, hệ thống đưa vào cập nhật liên tục (theo đơn vị 1 giờ, dùng log 3 giờ gần nhất)
  • Điều chỉnh learning rate động theo mức độ hoạt động (tối đa gấp 5 lần vào ban ngày trong tuần, gấp 2 lần vào ban đêm)
  • Hiện thực hóa việc thích ứng nhanhngăn mô hình lão hóa, phản ánh gợi ý nhanh mà không làm suy giảm hiệu năng
  • CTR tăng 24%

Lựa chọn mô hình chiến lược

  • Xác lập chiến lược mô hình hóa tối ưu cho từng store
  • Main store dùng DeepFM+Continual, còn các chuyên trang dùng mô hình Two-Tower riêng, giúp CTR tăng 19%

Kết quả cuối cùng

  • So với MAB hiện có, Two-Tower tăng 11,2%, DeepFM tăng 16,1% CTR
  • Trên thực tế, Musinsa áp dụng DeepFM+Continual Learning cho trang chủ Musinsa và mô hình Two-Tower cho các chuyên trang

Hướng đi tiếp theo

  • Hệ thống sẽ tiếp tục được nâng cấp theo các hướng như chuyển sang kiến trúc serving thời gian thực, đưa vào Multi-Task Learning (CTR+GGMV), cải thiện chất lượng embedding và cấu trúc đồ thị, đa dạng hóa chỉ số hiệu quả
  • Kế hoạch là phát triển từ mô hình chỉ dựa trên CTR đơn lẻ sang mô hình đánh giá được cả nhiều mục tiêu kinh doanh khác nhau và trải nghiệm chất lượng

1 bình luận

 
codemasterkimc 2025-06-05

Bài viết hay đấy ~