Hệ thống đề xuất là gì?
Hệ thống đề xuất sử dụng một tập hợp con của AI được gọi là kỹ thuật học máy và lọc dữ liệu để đưa ra các đề xuất. Khi chúng hoạt động tốt, hệ thống đề xuất AI sẽ đưa ra dự đoán chính xác về loại nội dung nào người dùng muốn dựa trên các lựa chọn, phản hồi và tương tác trong quá khứ.
Netflix, Amazon, eBay và hầu hết các nền tảng mạng xã hội đều có hệ thống đề xuất để giúp khách truy cập phân loại lượng nội dung khổng lồ để khám phá các mặt hàng cụ thể họ có thể quan tâm. Các giải pháp trí tuệ nhân tạo như trình đề xuất phổ biến trong cuộc sống hiện đại hàng ngày, gần như đến mức sự tồn tại của chúng là điều mọi người trông đợi. Tuy nhiên, để có hiệu quả tối ưu, chúng đòi hỏi lượng dữ liệu đáng kể, đào tạo mô hình AI và sức mạnh điện toán.
Người sử dụng đôi khi phụ thuộc vào các hệ thống đề xuất mà không biết rằng mình đang phụ thuộc. Việc chọn một bộ phim để xem trong số hàng trăm nghìn phim có thể là một thách thức không thể vượt qua, nhưng việc chọn một trong 100 phim sẽ giảm độ khó của quyết định. Khi các khuyến nghị chính xác và hệ thống phản hồi tốt, quá trình quyết định nên sử dụng sản phẩm nào trở nên liền mạch.
Các lợi ích của hệ thống đề xuất
Đối với các công ty muốn người dùng luôn tương tác, như các nền tảng mạng xã hội, hoặc tiếp tục đăng ký hay mua hàng, việc triển khai hệ thống đề xuất AI có thể giúp họ đạt được các mục tiêu đó. Trong một số trường hợp, hệ thống đề xuất hoạt động như một kệ mua hàng ngẫu hứng trong cửa hàng tạp hóa. Ở những nơi khác, nó giống như việc cung cấp các tiện ích bổ sung, chẳng hạn như tiện ích bảo vệ lốp xe tại đại lý xe hơi.
Người dùng cũng được hưởng lợi vì việc ra quyết định rất khó khăn. Ngay cả khi người dùng có ý tưởng về những gì họ muốn, việc lọc ra tất cả các mặt hàng họ không muốn có thể là một thách thức. Tìm kiếm danh mục phim về “phim hài” mang lại nhiều tùy chọn với gu khác nhau. Hệ thống đề xuất giúp người dùng thu hẹp lựa chọn để tìm ra điều gì hấp dẫn họ nhất.
Ngoài ra, trình đề xuất có thể giúp người dùng khám phá nội dung mới mà họ có thể không tìm thấy nếu không dùng trình đề xuất. Các dịch vụ phát trực tuyến âm nhạc như Pandora và Spotify là những ví dụ về các nền tảng mà người đăng ký thường sử dụng để tìm nội dung mới dựa trên sở thích của họ.
Hệ thống đề xuất hoạt động như thế nào?
Hệ thống đề xuất AI rất phức tạp và sử dụng một số mô hình AI, quy trình học máy và quy trình phân tích dữ liệu. Hầu hết các quy trình bao gồm ba giai đoạn chung:
- Phân loại: Trong giai đoạn này, công nghệ thị giác máy tính và xử lý ngôn ngữ tự nhiên (NLP) được sử dụng để xác định và phân loại các yếu tố khác nhau của nội dung.
- Tìm kiếm nhớ lại và tương tự: Tiếp theo, các vật phẩm hoặc đối tượng được phân loại theo các đặc điểm tương tự.
- Xếp hạng: Cuối cùng, các mô hình học rộng và sâu sắp xếp các vật phẩm hoặc đối tượng theo mức độ liên quan.
Ba giai đoạn này là cần thiết để mang lại kết quả chính xác và phù hợp và giảm nguy cơ thất vọng của người dùng, không chỉ với các khuyến nghị mà còn với công ty có hệ thống cung cấp chúng.
Các loại hệ thống đề xuất
Hệ thống đề xuất có thể tùy chỉnh vô tận và cần được thiết kế chặt chẽ với trường hợp sử dụng cụ thể. Thông thường, hệ thống đề xuất rơi vào ba loại nói chung:
- Lọc cộng tác: Hệ thống đề xuất lọc dữ liệu cộng tác yêu cầu thông tin tham khảo từ nhiều người dùng. Hệ thống nhận ra các mẫu: Những người thích bộ phim này cũng thường thích bộ phim khác như thế. Sau đó, hệ thống đề xuất bộ phim khác cho những người thích bộ phim đầu tiên.
Tương tự, nếu hai người dùng có chung hai mặt hàng, hệ thống đề xuất có thể đề xuất một mặt hàng mà một người đã đánh giá cao hoặc mua cho người kia có cùng sở thích. - Lọc dựa trên nội dung: Lọc dữ liệu dựa trên nội dung rất hữu ích trong các tình huống có ít thông tin hơn, chẳng hạn như khi người dùng đang nghiên cứu các mặt hàng mắc tiền hơn, không được mua thường xuyên như đồ nội thất hoặc thiết bị mới. Hệ thống đề xuất có thể đề xuất các mặt hàng có kích thước tương tự, với các đặc điểm tương tự hoặc trong phạm vi giá tương đương.
Sử dụng ví dụ về bộ phim trước đó, nếu người dùng đã xem hai bộ phim hành động, hệ thống đề xuất có thể đề xuất các tựa phim khác trong cùng thể loại đó. - Lọc kết hợp: Trình đề xuất sử dụng cả lọc dữ liệu cộng tác và dựa trên nội dung cung cấp các yếu tố của cả hai loại và đôi khi cũng bao gồm thông tin bối cảnh, chẳng hạn như vị trí, thời gian trong ngày và các dữ liệu khác, để đưa ra các đề xuất chính xác và hữu ích hơn.
Điều gì tạo nên hệ thống đề xuất tốt?
Mục tiêu hoạt động cho các hệ thống đề xuất là việc sử dụng lặp lại. Người dùng càng nhận thấy các đề xuất mà họ nhận được là “tốt”, có nghĩa là phù hợp với sở thích của họ, họ càng có nhiều khả năng quay lại và tái sử dụng hệ thống. Các thuộc tính của hệ thống đề xuất tốt bao gồm:
- Chính xác: Các đề xuất phải được cá nhân hóa cho người dùng. Có thể đạt được điều này bằng cách kết hợp hệ thống phản hồi đơn giản như nút thích hoặc không thích. Phản hồi củng cố và mở rộng quá trình học của AI.
- Phản hồi: Người dùng nổi tiếng là thiếu kiên nhẫn và sẽ không chờ đợi các đề xuất. Thời gian tải phải nhanh và dễ dàng, nếu không người dùng sẽ rời đi.
- Hiệu quả chi phí: Từ quan điểm kinh doanh, việc đầu tư vào hệ thống đề xuất và chi phí hoạt động liên tục phải được cân bằng bằng cách tăng mức độ tương tác, doanh số hoặc các kết quả kinh doanh khác.
Các trường hợp sử dụng hệ thống đề xuất
Hệ thống đề xuất phổ biến trong thế giới kỹ thuật số. Gần như tất cả các nhà bán lẻ thương mại điện tử đều có một số loại hệ thống đề xuất và hầu hết mọi người đều sử dụng chúng một cách liền mạch mà không cần nhận ra chúng là gì. Amazon là bên áp dụng sớm và nếu không có đề xuất, việc khám phá các sản phẩm mới có thể khá khó khăn.
Netflix cũng có hệ thống đề xuất mở rộng và không ngừng phát triển. Trên thực tế, từ năm 2007 đến năm 2009, Netflix đã cung cấp giải thưởng cho nhóm có thể xây dựng hệ thống đề xuất chính xác hơn 10%. Những người chiến thắng đã tạo ra một chuỗi gồm 107 mô hình khác nhau hoạt động cùng nhau để đưa ra dự đoán.1
Hai ứng dụng chính của hệ thống đề xuất AI là hàng hóa được cá nhân hóa, như trên eBay hoặc Amazon và nội dung được cá nhân hóa, chẳng hạn như trên các nền tảng mạng xã hội như Facebook hoặc LinkedIn.
Bán hàng được cá nhân hóa
Hầu hết các thương hiệu bán lẻ lớn đều có hệ thống đề xuất bán hàng được cá nhân hóa. Chúng có thể hoạt động theo một vài cách khác nhau.
Ví dụ: khi người dùng duyệt danh sách trên eBay, hệ thống đề xuất “khám phá các mặt hàng liên quan” cung cấp danh sách tương tự, với tùy chọn để đưa ra phản hồi về các đề xuất. Nhà bán lẻ quần áo Old Navy cung cấp cả đề xuất “khách hàng cũng thích” và “nên mặc với”.
Khi các hệ thống đề xuất được thuật toán AI hỗ trợ trở nên phổ biến hơn, chúng cũng đang được sử dụng theo những cách mới. Trong lĩnh vực ngân hàng, hệ thống đề xuất có thể được sử dụng để đề xuất an toàn các loại tài khoản, dịch vụ hoặc ưu đãi dựa trên hành vi tiết kiệm và chi tiêu của khách hàng, hoặc trong giáo dục, trình đề xuất có thể giúp học sinh quyết định nên đăng ký trường đại học nào.
Nội dung được cá nhân hóa
Người dùng tương tác với các hệ thống đề xuất một cách liền mạch trong suốt một ngày điển hình, đặc biệt là khi họ tiêu thụ nội dung phương tiện và giải trí. Google sử dụng hệ thống đề xuất để hiển thị quảng cáo cho người dùng; Meta sử dụng hệ thống đề xuất trên các sản phẩm của mình, bao gồm trang Instagram Explore, Facebook Reels và nguồn cấp dữ liệu chính mà người dùng nhìn thấy trên các nền tảng đó.
Cả Amazon và Netflix đều sử dụng học máy và lượng dữ liệu khổng lồ để đề xuất nội dung được cá nhân hóa. Thông tin người dùng xem, dữ liệu lịch sử tìm kiếm, xếp hạng, ngày tháng, giờ trong ngày và loại thiết bị được sử dụng đều được kết hợp lại thành công cụ đề xuất kết hợp, đa lớp.
Các đề xuất được cá nhân hóa, thay vì chỉ những gì phổ biến tại thời điểm này, có thể dẫn đến sự tương tác và khám phá sâu hơn nhiều—và cung cấp dữ liệu bổ sung để có các kết quả phù hợp hơn nữa.
Các thách thức của hệ thống đề xuất
Các đề xuất hữu ích cho cả tổ chức và người dùng, nhưng cũng tồn tại những thách thức tiềm ẩn. Việc nhận thức được những thách thức ngay từ khi bắt đầu xây dựng hệ thống đề xuất mang lại cơ hội để tránh các vấn đề sau này. Dưới đây là một vài thách thức đã biết liên quan đến các hệ thống đề xuất AI:
- Thưa thớt dữ liệu: Vào giai đoạn đầu của quá trình này, có thể nhiều mặt hàng hoặc sản phẩm chưa được đánh giá hoặc người dùng là người mới, vì vậy hệ thống đề xuất không có nhiều thông tin để tiếp tục. Ví dụ: Netflix, yêu cầu người dùng mới đánh giá các bộ phim họ đã xem. Các cơ chế phản hồi cơ bản, chẳng hạn như nút thích hoặc không thích hoặc xếp hạng theo sao, có thể giúp cung cấp một điểm khởi đầu.
- Vấn đề bắt đầu chậm chạp: Người dùng mới và các mặt hàng mới cũng gặp phải thách thức tương tự. Khi không đủ dữ liệu về sở thích của người dùng hoặc về một mặt hàng, hệ thống đề xuất không thể đưa ra các đề xuất chính xác và hữu ích. Ví dụ: hãy tưởng tượng một người dùng đang mua tủ lạnh mới và truy cập trang web bán lẻ mà họ chưa bao giờ xem trước đây. Hệ thống đề xuất của trang web không có bất kỳ thông tin nào về những gì người dùng đang tìm kiếm ngoài tìm kiếm hiện tại.
- Khả năng mở rộng: Việc mở rộng quy mô từ lượng dữ liệu tương đối nhỏ đến hàng triệu người dùng và các mặt hàng đòi hỏi cơ sở hạ tầng công nghệ được lên kế hoạch cẩn thận để cân bằng việc sử dụng và tăng tốc thời gian đạt được kết quả.
- Quá khớp và đa dạng: Hai thách thức này có liên quan và cả hai đều dẫn đến các mặt hàng phổ biến nhất được đề xuất quá thường xuyên. Khi hệ thống đề xuất bị quá khớp, dữ liệu đào tạo quá phù hợp với mô hình và thông tin mới không dễ dàng kết hợp vào đó. Khi các sản phẩm tương tự được đề xuất lặp đi lặp lại, tình trạng thiếu đa dạng khi đề xuất xuất hiện và người dùng có thể trở nên không còn quan tâm nữa. Sử dụng các số liệu như mức độ mất trật tự và tính mới lạ để đo lường sự đa dạng của các đề xuất có thể hữu ích.
- Sự phụ thuộc quá mức về thuật toán: Khi các đề xuất trở nên phổ biến hơn và là một phần của cuộc sống hàng ngày, mọi người có thể sử dụng chúng quá thường xuyên để đưa ra các quyết định và cuối cùng thường nhận được các bong bóng lọc (filter bubble) hoặc buồng vang thông tin (echo chamber). Điều này đặc biệt có vấn đề đối với những người dễ bị tổn thương hơn, chẳng hạn như trẻ vị thành niên, sử dụng các nền tảng mạng xã hội.
- Quyền riêng tư: Hệ thống đề xuất phải có quyền truy cập vào dữ liệu của người dùng, chẳng hạn như lịch sử trình duyệt và mua hàng của họ. Điều này có thể gây ra các vấn đề về quyền riêng tư. Các công ty triển khai các giải pháp AI cần nhận thức được rủi ro về bảo mật dữ liệu và quyền riêng tư và triển khai các giải pháp bảo mật để bảo vệ dữ liệu người dùng và doanh nghiệp. Ngoài ra, các công ty cần biết về các phương pháp sử dụng AI có trách nhiệm để đảm bảo AI đang được sử dụng một cách an toàn, đáng tin cậy và có đạo đức.
Tương lai của các hệ thống đề xuất
AI tạo sinh, lọc dữ liệu chính xác hơn, tăng lượng dữ liệu để lọc và cải thiện học máy và các mô hình ngôn ngữ lớn (LLM) đều chỉ ra sự cải thiện đều đặn trong cách các hệ thống đề xuất hoạt động tốt cho cả người dùng và công ty. Đối với các công ty chưa triển khai các hệ thống đề xuất, các công cụ để tùy chỉnh và đào tạo đề xuất hiệu quả đang trở nên dễ dàng để tiếp cận hơn.