Mục lục bài viết

Chào các bạn, tôi là Nguyễn Duy Khánh.

Gần đây, trong quá trình tư vấn hệ thống cho một đối tác chuyên cung cấp phụ liệu ngành tóc, chúng tôi đã có một cuộc thảo luận rất sâu về dữ liệu (Data). Đối tác này có một mô hình kinh doanh khá điển hình: Khách hàng đến từ Facebook Ads, Tiktok Shop, và cả mạng lưới truyền thống.

Tuy nhiên, đặc thù của họ là khách hàng (các chủ Salon) thường mua lặp lại nhiều lần. Đơn hàng đầu tiên có thể đến từ quảng cáo, nhưng 10 đơn hàng sau đó lại đến từ việc Telesales chăm sóc hoặc khách nhắn tin qua Zalo để đặt thêm.

Vấn đề đặt ra là: Meta (Facebook) hoàn toàn “mù” với những đơn hàng phía sau đó. Máy học chỉ thấy được đơn đầu tiên (hoặc tệ hơn là chỉ thấy khách để lại số điện thoại) và dừng lại.

Đây là lý do tôi viết bài này để nói về Dataset (tập dữ liệu) và cách “nuôi” con AI của Meta để nó thông minh hơn, giúp bạn kiếm được nhiều tiền hơn.

Dataset thực tế của NDK

Lời ngỏ: Đừng vội tin, hãy kiểm chứng

Trước khi đi sâu vào các kỹ thuật bên dưới, tôi muốn chúng ta thẳng thắn với nhau một điều.

Có thể ngay lúc này, bạn đang không có niềm tin. Bạn không tin vào cái gọi là “Trí tuệ nhân tạo” hay “Máy học” của Facebook – bạn nghĩ nó là bánh vẽ của nền tảng để “móc túi” nhà quảng cáo. Có thể bạn cũng chẳng tin tôi – một người lạ trên internet đang viết những dòng này. Và sâu hơn, có thể bạn đang hoài nghi chính mình, không tin rằng mình có thể làm chủ được công nghệ hay thay đổi được tình hình kinh doanh hiện tại.

Điều đó hoàn toàn bình thường. Với tư cách là một người làm hệ thống (System Builder), tôi cũng giống bạn: Tôi không tin vào lời hứa, tôi chỉ tin vào KẾT QUẢ đo lường được.

Vì vậy, bài viết này không phải là một “liều thuốc tiên” cam kết giúp bạn giàu sau một đêm. Đây là một lời mời THỬ NGHIỆM.

  • Bạn không mất gì nhiều: Chỉ tốn khoảng 15-20 phút để xuất một file Excel và upload thử.
  • Bạn không tốn thêm ngân sách quảng cáo: Chúng ta chỉ đang tối ưu lại những gì đã có.

Tôi đã áp dụng phương pháp này và thành công. Điều đó KHÔNG có nghĩa là chắc chắn 100% bạn cũng sẽ đạt kết quả y hệt, vì mỗi mô hình kinh doanh là một bài toán khác nhau.

Nhưng trong kinh doanh và kỹ thuật, nếu không thử (A/B Testing), chúng ta sẽ mãi mãi kẹt lại ở kết quả cũ. Hãy tạm gác sự hoài nghi sang một bên, coi đây là một phép thử nhỏ cho doanh nghiệp của bạn. Nếu hiệu quả, bạn thắng lớn. Nếu không, bạn có thêm một bài học mà chẳng mất mát gì.

Được chứ? Giờ thì chúng ta bắt đầu.

1. Thực tế: Khi nào máy học làm tốt và khi nào nó “bó tay”?

Với ngành bán lẻ (Retail) – Mua đứt bán đoạn

Kinh nghiệm vận hành của tôi cho thấy, với các ngành hàng bán lẻ, giá trị nhỏ, chốt đơn ngay trên website hoặc Landing Page, thì cơ chế chạy chuyển đổi (Purchase) trực tiếp của Facebook vẫn đang hoạt động rất ổn. Pixel bắt được hành vi mua hàng ngay lập tức. Chu trình khép kín và máy học hiểu ngay chân dung khách hàng.

Quảng cáo nhắm tới lượt mua (Chuyển đổi trong mess) rất dễ đo lường và tối ưu, đổi lại quá dễ chạy, cạnh tranh cao

Với ngành dịch vụ, bán buôn hoặc B2B

Câu chuyện hoàn toàn khác. Hành trình khách hàng ở đây dài và phức tạp hơn:

  1. Khách thấy quảng cáo -> Để lại Lead.
  2. Sale gọi điện tư vấn -> Chốt đơn (Offline).
  3. Khách dùng tốt -> Tháng sau quay lại mua tiếp số lượng lớn (Offline/Zalo).

Nếu bạn không gửi dữ liệu các lần mua hàng này ngược trở lại cho Meta (thông qua Dataset/Offline Events), thì Facebook sẽ hiểu sai. Nó sẽ nghĩ khách hàng đó không tiềm năng (vì không thấy mua trên web), hoặc nó sẽ tối ưu vào những tệp khách hàng “rác” chỉ biết click mà không biết chuyển tiền.

Quảng cáo dịch vụ, cực kỳ khó đo lường được hiệu quả doanh thu đến từ quảng cáo

2. Chiến lược ngân sách: Tại sao ai cũng cần Dataset?

Tôi thường chia làm 2 phe để phân tích lợi ích của việc này:

Phe ngân sách thấp (Low Budget)

Khi bạn chạy ngân sách nhỏ, dữ liệu là tài sản quý giá nhất.

Ví dụ: Bạn chỉ có 5-10 đơn hàng/ngày. Nếu bạn bỏ sót 2 đơn hàng diễn ra qua kênh Telesales/Zalo mà không báo lại cho Facebook, bạn đã làm mất đi 20-30% dữ liệu mẫu.

Với ngân sách thấp, mỗi một sự kiện (event) gửi lên là một manh mối cực kỳ quan trọng để máy học tìm ra người tiếp theo giống như vậy. Thiếu dữ liệu = Máy học ngu ngơ = Giá thầu đắt.

Thời gian dài vừa qua, ngân sách quảng cáo cho NDK MEDIA của tôi chỉ từ 50-100k/ngày

Phe ngân sách cao (High Budget)

Khi vít ngân sách lớn, vấn đề không phải là thiếu dữ liệu, mà là nhiễu loạn dữ liệu.

Lúc này, Dataset đóng vai trò là bộ lọc chất lượng (Quality Control). Bạn cần cho Facebook biết: “Đừng tìm những người chỉ mua đơn 100k nữa, hãy tìm những người có hành vi mua lặp lại với LTV (Giá trị trọn đời) trên 5 triệu đồng cho tôi.”

Chỉ có Dataset được update từ CRM/POS của bạn mới làm được điều này.

3. What – Who – Why: Hiểu đúng về Dataset

⚠️ Cảnh báo: Đừng nhầm lẫn giữa “Tệp đối tượng” và “Dataset”

Đây là sai lầm phổ biến nhất khiến 90% nhà quảng cáo bỏ cuộc khi mới thử nghiệm dữ liệu offline. Rất nhiều bạn nói với tôi: “Anh ơi, em cũng up số điện thoại khách mua lên rồi, em chạy Lookalike (Tệp tương tự) rồi mà có ra đơn đâu, lỗ chổng vó!”

Vấn đề là bạn đang nhầm lẫn nghiêm trọng giữa hai khái niệm: Targeting (Nhắm mục tiêu)Optimization (Tối ưu hóa).

Để tôi phân tích rõ sự khác biệt dưới góc độ kỹ thuật hệ thống:

1. Tệp đối tượng tùy chỉnh (Custom Audience)

  • Cách làm: Bạn vào mục Đối tượng (Audiences) -> Tải file khách hàng lên.
  • Bản chất: Đây là một Danh sách tĩnh. Bạn ném cho Facebook một cái danh sách và bảo: “Hãy hiển thị quảng cáo cho những người này (Retargeting) hoặc tìm người giống những người này (Lookalike).”
  • Tại sao thường không hiệu quả?
    • Dữ liệu bị “chết” (Static): Danh sách này không được cập nhật theo thời gian thực.
    • Máy học không hiểu “Hành vi”: Facebook chỉ biết đó là một danh sách người dùng, nó không thực sự hiểu những người này vừa mới mua hàng hôm qua hay đã mua từ 3 năm trước.
    • Thực tế: Chạy Lookalike từ tệp tĩnh hiện nay hiệu quả rất kém do hành vi người dùng thay đổi quá nhanh.

2. Dataset (Tập dữ liệu / Offline Events)

  • Cách làm: Bạn vào Trình quản lý sự kiện (Events Manager) -> Upload sự kiện mua hàng.
  • Bản chất: Đây là Tín hiệu huấn luyện (Training Signal). Bạn không chỉ ném số điện thoại, bạn ném kèm cả: Thời gian mua, Giá trị đơn hàng (Value), Loại tiền tệ.
  • Tác dụng: Bạn đang “dạy” con AI. Bạn bảo nó: “Này AI, cái ông A này vừa trả cho tao 5 triệu lúc 10h sáng nay. Hãy dùng dữ liệu này để học và tìm ngay cho tao người tiếp theo có khả năng chi 5 triệu như thế.”
  • Sự khác biệt: Khi dùng Dataset, bạn không cần target gì cả (thả Broad). Chính cái Dataset sẽ điều hướng luồng phân phối của Facebook đến đúng người cần mua.

📌 Tóm lại:

  • Up tệp Audience: Là bạn đang cố gắng chỉ đạo Facebook phải hiển thị cho ai (Targeting).
  • Up Dataset: Là bạn cung cấp dữ liệu gốc để Facebook tự học và tự tìm khách cho bạn (Optimization).

What: Dataset là gì?

Hiểu đơn giản theo tư duy kỹ thuật: Dataset (trước đây thường gọi là Offline Events) là một “cây cầu” nối giữa phần mềm bán hàng/file Excel của bạn với tài khoản quảng cáo Facebook. Nó cho phép bạn upload thông tin những người đã mua hàng thật sự (SĐT, Email, Giá trị đơn hàng) lên để Facebook đối soát.

Who: Ai cần làm việc này?

  • Nhà bán hàng có đội Telesales chốt đơn sau khi khách điền form.
  • Ngành Spa, Thẩm mỹ viện, Nha khoa (Khách đến tiệm mới trả tiền).
  • Ngành bán buôn, phân phối (Khách mua sỉ qua Zalo/điện thoại).
  • Bất động sản, Ô tô, Giáo dục.
  • Why: Tại sao phải làm ngay?
  1. Tăng độ chính xác: Giúp Facebook biết chính xác ai là người trả tiền, chứ không phải ai là người thích click.
  2. Tối ưu ROI: Đo lường được chính xác doanh thu trên chi phí quảng cáo (ROAS) thực tế, bao gồm cả các đơn hàng phát sinh sau này.
  3. Tạo tệp Lookalike chất lượng: Tạo ra tệp khách hàng tương tự (Lookalike) từ danh sách những người “đã chi nhiều tiền nhất” để chạy quảng cáo.

4. How: Cách triển khai (Từ thủ công đến tự động)

Là một người làm automation, tôi luôn hướng tới việc tự động hóa. Tuy nhiên, để hiểu bản chất, bạn nên bắt đầu từ việc làm thủ công.

Bước 1: Chuẩn bị dữ liệu (Data Cleaning)

Mình chỉ dùng BM nên không chắc việc tài khoản cá nhân có tạo được hay không, bạn hãy thử với TK cá nhân nhé

Dữ liệu từ phần mềm bán hàng hoặc File Excel của bạn cần có các trường tối thiểu sau:

  • Số điện thoại (bắt buộc – định dạng +84…)
  • Giá trị đơn hàng (Value)
  • Thời gian mua hàng (Event Time)
  • Tên sự kiện (Purchase)

Trường mở rộng (ko bắt buộc) nếu càng rõ ràng thì tỉ lệ math của Meta càng chuẩn:

  • Ngày sinh
  • Giới tính
  • Tỉnh thành phố
  • Email
  • Sản phẩm khách mua (hoặc tên dịch vụ)

Bước 2: Tạo Dataset trong Trình quản lý sự kiện (Events Manager)

Vào Business Manager -> Nguồn dữ liệu -> Dataset (Tập dữ liệu) -> Tạo mới.

Bước 3: Import hàng tuần (Quy trình thủ công)

Đây là cách tôi khuyên các đối tác mới làm để rèn tính kỷ luật:

  • Thứ 2 hàng tuần: Xuất file từ phần mềm bán hàng ra.
  • Lọc những đơn thành công.
  • Upload file CSV lên Dataset của Facebook.
  • Chờ Facebook “Map” (khớp) dữ liệu và xem kết quả khớp lệnh (Match rate). Tỷ lệ khớp trên 60-70% là rất tốt.

Bấm vào Thêm sự kiện

Chọn Thêm quá trình tích hợp mới (dòng số 2)

Chọn tải tệp lên

Chọn file csv là xong, nếu chưa biết file mẫu thì bạn tải file mẫu về nhé (nút trên cùng bên phải)

 

P/s: Xử lý file csv:
Bạn không nên sửa trực tiếp file csv, hãy vào Google Sheet, thêm tệp csv vào bằng cách Tạo file mới, chọn tệp, chọn nhập

Chọn Tải lên, sau đó chọn file là xong phần có file mẫu

Tiếp tục với file mẫu, xoá các cột ko quan trọng đi nhé

Chỉ nên để các cột như trong hình
Hãy để sđt bắt đầu là 84 (Quan trọng nhất)

Event name để Purchase (tức là lượt mua/chuyển đổi)

Event time là thời điểm diễn ra sự kiện, tức là thời điểm chốt đơn đó,phần này nên để chính xác, như cách bên thuế yêu cầu về xuất hoá đơn ý, rất quan trọng để AI biết rõ nhóm người này thường mua hàng vào lúc nào

Value là giá trị

Currency là loại tiền (VND cho nhanh)

fn là họ tên (thật ra là first_name nhưng nó ko quan trọng lắm)

Sau khi làm xong, xuất file csv bằng cách bấm vào tệp, chọn xuất ra và chọn file csv thì mới input lên dataset được nhé

Bước 4: Tự động hóa (Automation – Level nâng cao)

Sau khi đã làm quen, tôi (với vai trò System Architect) sẽ không để bạn làm tay mãi. Chúng ta sẽ dùng API.

Sử dụng các công cụ như n8n hoặc Zapier để nối thẳng CRM/Google Sheets của bạn với Meta Conversions API. Cứ có đơn thành công trên hệ thống -> Tự động bắn tín hiệu về Facebook ngay lập tức (Real-time). Đây là cách tôi đang triển khai cho chính mình và các khách hàng sâu.

Đề xuất: nếu bạn gửi đều đặn và thấy hiệu quả, bạn có thể sử dụng dịch vụ Automation của Khánh để giúp bạn tự động hoá tác vụ này, đơn hàng được gửi đi ngay lập tức khi phát sinh từ Tiktokshop, Pos hoặc bất cứ phần mềm nào có chức năng webhook hoặc api, không cần làm thủ công nữa. (Ngon rồi thì đầu tư 1 tí để trải nghiệm thế nào là tự động hoá)

Lời kết

Việc sử dụng Dataset và CAPI không phải là “chiếc đũa thần” giúp quảng cáo rẻ đi ngay lập tức vào ngày mai. Nhưng nó là nền tảng cốt lõi để doanh nghiệp của bạn sống sót và cạnh tranh khi máy học ngày càng chiếm vai trò chủ đạo.

Tôi đã áp dụng quy trình này cho hệ thống của mình và nhiều đối tác, kết quả là sự ổn định và khả năng mở rộng (scale) tốt hơn rất nhiều so với việc chỉ phụ thuộc vào Pixel trình duyệt.

Bài viết này là một gợi ý mang tính kỹ thuật và chiến lược. Bạn có thể thử nghiệm, đo lường và đưa ra quyết định phù hợp cho doanh nghiệp của mình. Với tôi, làm kinh doanh là phải dựa trên dữ liệu, và Dataset chính là cách chúng ta tôn trọng dữ liệu đó.


Về tác giả:

Tôi là Nguyễn Duy Khánh – Founder & System Architect tại NDK Media.

Tôi giúp doanh nghiệp xây dựng hệ thống kinh doanh tự động, lấy dữ liệu làm trung tâm.

  • Dịch vụ Quảng cáo (Facebook/Google): Tập trung vào hiệu quả chuyển đổi thực tế.
  • Zalo OA & Automation: Xây dựng luồng chăm sóc khách hàng tự động và CRM.
  • Đào tạo & Coaching: Hướng dẫn tư duy và kỹ thuật xây dựng hệ thống (n8n, AppSheet, API).

Kết nối với tôi để bàn về bài toán của bạn.