目录
前言
📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。
🚀
对毕设有任何疑问都可以问学长哦!
选题指导:
https://blog.csdn.net/qq_37340229/article/details/128243277
大家好,这里是海浪学长毕设专题,本次分享的课题是
🎯
基于深度学习的推荐系统研究
课题背景和意义
深度学习是机器学习领域一个重要的研究方向
,
近年来在图像处理
、
自然语言理解
、
语音识别和在线广告等领域取得了突破性进展.
将深度学习融入推荐系统中
,
研究如何整合海量的多源异构数据
,
构建更加贴合用户偏好需求的用户模型,
以提高推荐系统的性能和用户满意度
,
成为基于深度学习的推荐系统的主要任务
。近年来,随着云计算、大数据、物联网等 技 术 的迅猛发展,互联网空间中各类应用的层出不穷引发了数据 规 模 的 爆 炸 式 增 长,但同时也带来了严重的“信息过载”问题,如何快速有效地从纷繁复杂的数据中获取有价值的信息成为了当前大数据发展的关键难题.推荐系统作为解决“信息过载”问题的有效方法,已经成为学术界和工业界的关注热点并得到了广泛应用,形成了众多相关研究成果.推荐系统根据用户需求、兴趣等,通过推荐算法从海量数据中挖掘出用户感兴趣的项目(如信息、服务、物品等),并将结果以个性化列表的形式推荐给用户.
实现技术思路
一、传统推荐系统
推 荐 算 法 对 未 知评分的预测能够 采 用 不 同 的 方 法,
包 括 近 似 理 论
、机器学习和各种启发式方法等.
但 是 传 统 的 推 荐方法主 要 可 以 分 为 以 下 3
种
:
基 于 内 容 的 推 荐
、
协同过滤推荐
和混合推荐
。
(
1
)
基于 内 容 的 推 荐
.
主 要 根 据 用 户 已 经 选 择或者评分的项目,
挖掘其它内容上相似的项目作为推荐,
属 于
Schafer
划 分
中的项目到项目关联
的方法
(
2
)
协同 过 滤 推 荐
.
源 于 现 实 生 活 中 口 碑 相 传的过程,
协同过滤利用相似用户之间具有相似兴趣偏好的方法,
来发现用户对项目的潜在偏好。
(
3
)
混合 推 荐
.
考虑到单一推荐方法都存在各自的不足,
通过组合不同的推荐算法进行混合推荐
,往往能够产生更好的推荐性能。
二、深度学习技术
自编码器
自编码器
(
Au- toencoder,
AE
)
的 概 念
,
并将其用于高维复杂数据处理.
自编码器通过一个编码和一个解码过程来重构输入数据,
学习数据的隐层表示
.
基本的自编码器可视为一个三层神经网络结构:
一个输入层
x
、
一个隐层h
和一个输 出 层
y
,其中输出层和输入层具有相同的规模。结构如图:
自编码器的目的是使得输入
x
与输出
y
尽可能接近,
这种接近程度通过重构误差表示。
受限玻尔兹曼机
玻尔兹曼机
是一种生成式随机神经网络,
BM
由一些可见单元
(
对应可见变量
, 亦即数据样本)
和一些隐层单元
(
对应隐层变量
)
构成,
可见变量 和 隐 层 变 量 都 是 二 元 变 量
,
其 状 态 取0-1
,
状态
0
表示 该 神 经 元 处 于 抑 制 状 态
,
状 态
1代表该神经元处于激活状态。其中
两层之间的节点是全连接的,同层节点间是互不连接的,包括可见层v以及隐层h。
深度信念网络
深度信念网络
,
其 是一种由多层非线性变量连接组成的生成式模型.
在深度信念网络中,
靠近可见层的部分是多个贝叶斯信念网络
, 最远离可见层的部分则是一个 RBM。
DBN 的结构可以看作由多个受限玻尔兹曼机层叠构成,网络中前一个 RBM
的隐层视为下一 个RBM 的可见层。
卷积神经网络
卷积神经网络
(CNN)
已成为当前图像理解领域的研究热点
。
卷积神经网络是一种多层感知机,
主要被用来处理
二维图像数据.
当网络的输入是多维图像时,
通过将图像直接作为网络的输入,
从而避免了传统图像处理算法中复杂的特征提取和数据重建过程.
卷积神经网络的基本结构由输入层、
卷积层
、
下采样层
(
池化层
)、
全连接层和输出层构成。
循环神经网络
1986 年
提 出 循 环 神 经 网 络 (RecurrentNeuralNetwork
,
RNN
)
的概念
.
普通的全连接网络或卷积神经网络,
是从输入层到隐层再到输出层的结构,
层与层之间是全连接的
,
每层之间的节点是无连接的。
RNN 的最大特点在于神经网络各隐层之间的节点是具有连接的,就是说 RNN
能够对过去的信息进行记忆。
理论上来说,
RNN
能够对任意长度的序列数据进行建模,
但在实际应用中往往假设当前状态仅与前几个时刻的历史状态相关,
从而帮助降低模型的复杂度
四、基于深度学习的推荐系统
基于深度学习的推荐系统通常将各类用户和项目相关的数据作为输入,
利用深度学习模型学习到
用户和项目的隐表示
,
并基于这种隐表示为用户产生项目推荐.
包含输入层、模型层和输出层
.
输入层的数据主要包括
:
用户的显式反馈(
评 分
、
喜 欢
/
不 喜 欢
)
或隐式反馈数据(浏览
、
点击等行为数据
)、
用户画像
(
性别
、
年龄
、
喜好等)
和项目内容
(
文本
、
图像等描述或内容
)
数据
、用户生 成 内 容 (
社 会 化 关 系
、
标 注
、
评 论 等 辅 助 数 据)
1、深度学习在基于内容的推荐系统中的应用
将深度结构化语义模型(
DeepStructuredSemanticModels
, DSSM)
进行扩展
,
提出了一种多视角深度神经网络模 型(
Multi-View DeepNeuralNetwork
,
Multi- ViewDNN),该模型通过用户和项目两种信息实体
的语义匹配来实现用户的项目推荐
,
是一种实用性非常强的基于内容的推荐方法.
2)深广学习模型
通过 利 用 用 户 特 征、
情境特征和项目特征等多源异构数据
,
提出了一种深广学习(
Wide&DeepLearning
)
模型
,
用于手机APP推荐
,
模型同时具有了高的记忆
(
memorization)
能力和泛 化(
generalization
)
能 力
.
记 忆 主 要 依 靠 统计方法,通过关联学习分析历史记录中的共现现象,主要利用了相关性,不具有泛化性且需要手动特征工程。
3)基于
MLP
的 广 告 点 击 率 预 测
为了有效建 模 这 类 数 据,
学 习 特 征 之 间 的 交 互 至 关 重要
.
其中一种 思 路 是 利 用 MLP 直 接 学 习 特 征之间的交互。例如Deep&Cros。
DeepCrossing的模型结构是由一个嵌入层、一个堆栈层、一个残差单元 和 一 个 评 分 层 组 成 的 多 层 感 知 机。
另 一 种 思 路 是 结合因 子 化 机与 MLP,首先利用因子化机建模特征之间的成对交互,然后通过增加全连接层来进一步建模高阶的特征交互,例 如 PNN。基于因 子 化 机 模 型 和 MLP 提 出 了一 个 基 于 产 品 的 神 经 网 络 模 型 (Product-based NeuralNetwork,PNN).PNN由一个特征嵌入
层、
一个成对特征交互层和两个全连接层组成.
基于
MLP
的
YouTube
视频推荐方法
Covington等人
通过利用用户信息
、
情境信息
、
历史行为数据和项目的特征信息等多源异构数据,
提出了一种深度神经网络模型用于 YouTube视频推荐。Covington
等人
提出的方法的模型架构:
基于卷积神经网络
基于注意力
CNN
基于注意力的卷积神经网络(CNN
)
来 进 行 微 博 中的 Hashtag
推 荐
.
总 的 来 说
,
将
Hashtag
推 荐作为一个多标记分类问题,
CNN
被作为一种特征提取手段来获取微博的特征.
基于循环神经网络的方法
基于注意力的
RNN
基于注意力的 LSTM 来进行微博中的 Hashtag推荐,注意力机制与 RNN 结合的优势是能够抓住文本的序列特征,
同时能够从微博中识别最具有信息量的词
.模型首 先 利 用 LSTM
来 学 习 微 博 的 隐 状 态
(
h
1
,h2
,…,
h
N
),同 时 采 用 主 题 模 型 来 学 习 微 博 的 主 题分布.
模型的架构如图:
基于深度信念网络的方法
传统的基于内容的音乐推荐将音乐内容特征提取与音乐推荐分为两个独立过程,这可 能 导 致 推 荐性能的不足,通过深度信念网络和概率矩 阵分解 (Probabilistic MatrixFactorization,
PMF
)
将两个过程组合到一个统一框架中,
提升了音乐推荐的性能。
2、深度学习在协同过滤中的应用
基于
RBM
的协同过滤
2017年,首次
提出一种基于受限玻尔兹曼机的协同过滤推荐模型.
假设有m
部电影
,
则使用
m
个
Softmax
单元来作为可见单元构造 RBM.
每个用户都有一个单独的
RBM
,对于不同的 RBM
仅仅是可见单元不同
,
因 为 不 同的用 户 会 对 相 同 的 电 影 打 分,
因 此 所 有 这 些
RBM的可见单元共享相同的偏置以及可见单元与隐层单元的连接权值 W。
基于自编码器的协同过滤方法
自编码 器 也 被 应 用 于 协 同 过 滤 中,
其 通 过对用户或项目的显式或隐式反馈数据进行重构, 能够学习用户或项目的隐表示,并基于这种隐表示预测用户对项目的偏好,通过最小化自编码器的重构误差 l(
R
i
,
R
′i)
训练得到模型的参数
,
最后对未知评分进行预测:
基于自编码器的协同过滤方法的模型架构:
3、深度学习在混合推荐系统中的应用
基于自编码器的混合推荐方法
当前
,
自编码器在基于深度学习的混合推荐方法中应用最为广泛.
基于自编码器的混合推荐方法 的基本架构如图,
自编码器由于具有强的表示学习能力,
很自然地用来从用户特征
X
或项目特征Y
中学习用户隐表示
U
或项目隐表示
V。
协同深度学习模型
提出一种贝叶斯版本的降噪自编码器模型,
即贝叶斯栈式降噪自编码 器模型
(
BayesianSDAE),
然 后 组 合
BayesianSDAE
和 概 率 矩 阵 分解,
提出 了 一 种 协 同 深 度 学 习
(
CollaborativeDeep Learning,
CDL
)
混合 推 荐 方 法
.
该方法主要利用项目的文本类辅助数据,
采用
BayesianSDAE
学习项目的隐表示.
基于深度学习的位置社交网络序列模式建模
基于 MLP
的 推 荐 方 法
POI
推荐方法都是针对特定的数据和问题 而设计,
提出了一种通用的半监督学习模型
,
即偏好与情境嵌入模型(
PreferenceandContextEmbedding
, PACE),
能够利用相邻用户和位置的信息来缓解推荐系统的数据稀疏问题.PACE
首 先 构 建 情 境 图 作为观测数据,
包括利用位置间的距离构建的位置图
,以及利用用户间的朋友关系构建的用户图.
实现效果图样例
数据个性化推荐系统实践:
常见的推荐系统应用场景:
我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。
毕设帮助,疑难解答,欢迎打扰!
最后