聊聊怎麼用MySQL快速實現一個推薦演演算法

2023-01-04 18:00:30
本篇文章給大家帶來了關於MySQL的相關知識,其中主要介紹了什麼是推薦演演算法,這個演演算法能幫我們解決什麼問題,又如何用MySQL來實現一個簡單的推薦演演算法,感興趣的朋友一起來看一下吧,希望對大家有幫助。

使用MySQL實現一個簡單的推薦演演算法

推薦演演算法是會經常遇到的技術。主要解決的是問題是:如果你喜歡書 A,那麼你可能會喜歡書 B。

本文我們使用 MySQL ,基於資料統計,拆解實現了一個簡單的推薦演演算法。

首先,建立一個 使用者喜歡的書資料表,所表示的是 user_id 喜歡 book_id。

CREATE TABLE user_likes (
    user_id INT NOT NULL,
    book_id VARCHAR(10) NOT NULL,
    PRIMARY KEY (user_id,book_id),
    UNIQUE KEY book_id (book_id, user_id)
);
CREATE TABLE user_likes_similar (
    user_id INT NOT NULL,
    liked_user_id INT NOT NULL,
    rank INT NOT NULL,
    KEY book_id (user_id, liked_user_id)
);
登入後複製

插入 4 條測試資料

INSERT INTO user_likes VALUES (1, 'A'), (1, 'B'), (1, 'C');
INSERT INTO user_likes VALUES (2, 'A'), (2, 'B'), (2, 'C'), (2,'D');
INSERT INTO user_likes VALUES (3, 'X'), (3, 'Y'), (3, 'C'), (3,'Z');
INSERT INTO user_likes VALUES (4, 'W'), (4, 'Q'), (4, 'C'), (4,'Z');
登入後複製

代表的含義為:使用者 1 喜歡 A、B、C,使用者 2 喜歡 A、B、C、D,使用者 3 喜歡 X、Y、C、Z,使用者 4 喜歡 W、Q、C、Z。

以為使用者 1 計算推薦書籍為例,我們需要計算使用者 1 和其他使用者的相似度,然後根據相似度排序。

清空相似度資料表

DELETE FROM user_likes_similar WHERE user_id = 1;
登入後複製

計算使用者相似度資料表

INSERT INTO user_likes_similar
SELECT 1 AS user_id, similar.user_id AS liked_user_id, COUNT(*) AS rank
    FROM user_likes target
    JOIN user_likes similar ON target.book_id= similar.book_id AND target.user_id != similar.user_id
    WHERE target.user_id = 1
    GROUP BY similar.user_id ;
登入後複製

可以看到查詢到的相似度結果為

user_id, liked_user_id, rank
1, 2, 2
1, 3, 1
1, 4, 1
登入後複製

然後根據相似度排序,取前 10 個,就是推薦的書籍了。

SELECT similar.book_id, SUM(user_likes_similar.rank) AS total_rank
    FROM user_likes_similar
    JOIN user_likes similar ON user_likes_similar.liked_user_id = similar.user_id
    LEFT JOIN user_likes target ON target.user_id = 1 AND target.book_id = similar.book_id
    WHERE user_likes_similar.user_id = 1 AND target.book_id IS NULL
    GROUP BY similar.book_id
    ORDER BY total_rank desc
    LIMIT 10;
登入後複製

【推薦學習:】

以上就是聊聊怎麼用MySQL快速實現一個推薦演演算法的詳細內容,更多請關注TW511.COM其它相關文章!