毕设学习推荐系统的实现之Python

代码海岸 • 2024年05月14日 11:45 • 其他源码 • 阅读 3

主动学习推荐系统 0，概述数据集： Amazon商品数据集编程环境：Python， Matlab， Markdown 1

本文包含相关资料包-----> 点击直达获取<-------

主动学习推荐系统

0. 概述

数据集： Amazon商品数据集
编程环境：Python, Matlab, Markdown

1. 数据预处理

商品信息
提取数据集中的title和description信息
命令： python item_information.py [file1, ..., file3]
用户物品评分信息
提取用户-物品评分，划分train集和test集
将train集中的用户作为用户全集，以防止出现train集中有用户没有评分的情况
命令： python user_information.py [file1, ..., file7]
商品相似度生成
title: 分词 + LDA主题模型（topic number = 15）
description: 分词 + LDA主题模型（topic number = 15）
未使用price（缺失值太多）
未使用category（同类商品）
命令： python item_similarity.py [topic number, file1, ..., file6]
商品description和title相似度权重生成
non linear regression
Similarity(i1, i2) = weight1 * S_title(i1) + weight2 * S_description(i2)
命令：
- python similarity_parameters.py [file1, ..., file7]
- fitnlm(path, param1, param2)
用户相似度生成
评分相似度
命令： python user_similarity.py [file1, ..., file3]
用户聚类
用户聚类依靠用户相似度作为距离度量，使用K-medoids作为聚类算法
问题主要存在于：由于评分稀疏，很多用户之间距离为0
命令： python user_clustering.py input_file number_of_clusters output_file
建树前的准备工作
生成用户聚类对任一物品的平均评分，便于计算时直接调用
利用非线性回归拟合的参数生成相似度矩阵
命令： python buildtree_preparation.py input_file init_ptitle init_pdescrip output_file

2. 建树及预测

树的生成：
三叉树，对应不喜欢、一般般喜欢和喜欢三个节点
生成的节点信息用 self.tree 和 self.node_interval 两个变量保存
构建预测模型：
利用Spark的mllib包实现ALS Matrix Factorization
生成伪物品（每个节点）和用户对应的latent vector（对每一层都计算）
预测评分：
对每一个test商品，从树的根节点开始向下走，利用目标叶子节点的latent vector作为它的特征向量
利用特征向量和所有物品的特征向量的点积预测评分，计算RMSE（对每一层都计算）
命令： python build_tree.py [input_file1, ..., input_file5] desired_depth

3. 运行

利用 Python 脚本运行上述所有步骤： python script.py
代码开头数据集名称（ dataset ）需相应更改

4. 对比实验

FDT (Factorized Deicision Tree)
python factorized_decision_tree.py dataset depth (dataset是数据集的名字，depth决定了树的高度)
输入： I*U 的矩阵 => new-user problem
输入： U*I 的矩阵 => new-item problem
CAL (Content-based Active Learning)
- python content_based_active_learning.py dataset K (dataset是数据集的名字，K决定了选择TopK的用户进行query)
CBCF (Content-based Collaborative Filtering)

4. 当前问题

对Amazon数据集来说树的第一层预测效果最好，分析原因可能如下：
数据集过于稀疏，导致每一用户基本只有一个评分，第一层作为伪物品作矩阵分解时评分满，效果好，越往下效果越差。
点的划分过于不均匀，使得伪物品选择不优秀。
解决方法：
使用平均划分法划分每一个节点
使用相似度拟合评分作为MF的输入，而非平均评分
物品个数超过30万的Automotive集合上计算 item similarity 时出现 Memory Error
解决方法：选择评分个数大于5个的物品和用户

参考文献

现代远程教育系统个性化推荐算法研究（电子科技大学·王娜）
百色学院毕业设计管理系统的设计与实现（电子科技大学·农纳曼）
基于Mongodb推荐系统的研究与应用（华中科技大学·和慧）
个性化资讯推荐系统的设计与实现（山东大学·仵贇）
基于协同过滤推荐算法的选课系统的设计与实现（首都经济贸易大学·艾岩）
基于分布式的个性化推荐系统的设计与实现（华中科技大学·唐赛）
基于学习平台日志挖掘的在线学习推荐系统实现（大连海事大学·李晶涛）
基于协同过滤推荐算法的选课系统的设计与实现（首都经济贸易大学·艾岩）
出版物作者推荐系统的研究与实现（北京印刷学院·张莉婧）
基于协同过滤推荐算法的选课系统的设计与实现（首都经济贸易大学·艾岩）
基于GWT和个性化算法的教学资源推荐系统的研究（沈阳师范大学·张业骏）
基于协同过滤推荐算法的选课系统的设计与实现（首都经济贸易大学·艾岩）
基于知识图谱个性化学习推荐系统的研究与实现（辽宁大学·孙嘉奇）
基于数据挖掘的电视节目个性化推荐研究及实现（曲阜师范大学·徐晟杰）
基于知识图谱个性化学习推荐系统的研究与实现（辽宁大学·孙嘉奇）

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：代码海岸，原文地址：https://m.bishedaima.com/yuanma/35724.html

实现 Python 推荐学习毕设

资源下载

本站所有项目都经过严格测试,直连告诉下载项目包, 毕设课设定制需求, 点此提交表单

代码都经过了认真的调试,不免费哦联系QQ2625289483 更多资料关注公号: 大学生学习圈

基于JAVA的远程屏幕监控系统

基于JAVA的远程屏幕监控系统摘要远程屏幕监控系统在生活中是很常见的，学校机房的机房管理系统，PC版QQ的远程演示功能等都属于远程屏幕监控系统

毕设助手
2024年05月14日
3 1 1 2
基于Python实现数字图像可视化水印系统

一，经典数字图像水印算法 1，LSB 算法 LSB（Least Significant Bits）算法，全称为最低有效位算法，是利用载体对象的二进制的最低一位（或几位）来进行秘密信息的隐藏

代码客栈
2024年05月14日
2 1 1 1
基于SpringBoot框架的商业辅助决策系统

这是一套采用Java语言，基于SpringBoot框架构建的商业化决策支持系统源代码，开发工具为Idea或Eclipse，前端采用了Vue技术，该项目可作为毕业设计或课程设计的理想选择

代码导航
2024年05月23日
22 1 4 3
基于SpringBoot框架的媒体素材库平台

这是一份采用🔥🔥SpringBoot为核心的多媒体资源库应用的源代码，主要编程语言为Java，并结合了SpringBoot和Vue，js技术进行开发，开发工具包括Idea或Eclipse

源码码头
2024年05月23日
4 1 2 1
基于SpringBoot框架的英语知识应用网站

这是一份采用🔥🔥SpringBoot框架构建的英语学习平台的源代码项目，主要编程语言为Java，并结合了SpringBoot和Vue技术，开发工具包括Idea或Eclipse

源码工厂
2024年05月23日
11 1 2 2
Python之简易音乐播放器设计

伪网易云的简易音乐播放器总体设计 1，1GUI 排版布局设计（pyqt5）大概包括搜索框，图片显示框，进度条框等部件，以及搜索栏，最近播放，喜爱的歌，歌词显示

毕业设计驿站
2024年05月14日
5 1 3 1
文章发布系统(jsp)

Article-Publishing-System 随着计算机技术的迅速发展，网络正以一种前所未有的冲击力影响着人类的生产和生活，网络的快速发展，颠覆了传统的信息传播方式

毕设助手
2024年05月14日
204 1 28 23
基于SpringBoot框架的智能学习平台系统

这是一套采用Java语言开发的🌟🌟SpringBoot为核心的智慧学习平台源代码，该项目利用了SpringBoot框架及Vue技术进行构建，开发工具为Idea或Eclipse

源码货栈
2024年05月23日
7 1 4 1
基于SpringBoot框架的图书商城管理系统

这是一套采用🔥🔥SpringBoot为核心的图书购物中心应用源代码🔥🔥，主要编程语言为Java，并结合了SpringBoot和Vue，js技术栈，开发工具为Idea或Eclipse

毕设工厂
2024年05月23日
19 1 4 2
基于 Python 制作的迷宫小游戏

基于 Python 制作的迷宫小游戏导语大家假日愉快呀~不想出门看人山人海，所以干脆过来更波公众号好了~ 有一个月没更小游戏系列的文章了

毕设工厂
2024年05月14日
3 1 1 1

发表回复

登录后才能评论