毕业设计题目为个性化的新闻推荐系统。不知道该如何入门和具体我应该做哪些方面(主要是机器学习这一块)。? 如果你的课题就是一个系统工程,然后你之前没有对推荐系统有较深的研究,那么首先建议先跳出自己的毕设课题,先把推荐系统的架构理解好。 这里先分享一下笔者对通用推荐系统的理解: 具体的来说,一个完整的工业级推荐系统至少由以下几环节组成: 数据ETL读取用户数据(离线+近线+在线)读取物品数据(离线+近线+在线)读取场景数据(离线+在线)读取候选物品库数据(在线)对上述数据做离线做特征工程,然后导入近线和在线层数据库可用技术栈 HDFS(离线)+Spark(离线)+Flink(在线+近线)+Redis(在线+近线)算法模型训练离线训练评估指标 AUC/Recall/RMSE近线迭代可用技术栈 TensorFlow/Spark MLlib算法模型打分在线存在召回+排序+重排三个阶段技术栈 CF/LR/FM/MLP推荐结果展示在线线上效果评估AB Testing存储数据记录用户和推荐系统的交互日志(在线+近线+离线),用于cycle上述流程。 以上来自笔者专栏文章:秋雨淅淅l:推荐系统架构浅谈
推荐系统逻辑架构(图出于王喆《深度学习推荐系统实战》) 在大致了解了推荐系统的架构后,剩下的就是各个击破了,当然鉴于你只需要做离线部分,你需要了解和学习的主要内容如下:在数据层,你需要了解当下主流的大数据存储和计算引擎是什么,然后考虑是否要用到你的课题里;推荐算法的设计和创新点;一般来说这会是在校生毕业论文的核心部分。 然后这里面有三个关键问题。第一是,你的数据源从哪里来的,数据源可不可信,数据量大不大;第二是要选用什么算法(这里就需要你熟悉主流推荐算法模型了,你需要选择好又创新又适配你数据源的算法);第三是怎么去评估自己的模型好坏。因为光跑通数据是没用的,你需要告诉课题组的老师,你的算法的研究的意义在哪里,创新在哪里,而这就需要一个能说服人的指标。 3.最后就是可似化了,这部分你应该需要做一个简单的前端; 然后如果你对推荐算法的发展和理论技术不熟悉,你需要话比较长的时间去做文献阅读,关于这部分内容欢迎来笔者的专栏一起讨论学习: 推荐算法学习笔记
图 传统推荐模型的演化关系图(图片参考王喆《深度学习推荐系统》一书)
图 经典深度推荐模型演化图谱(图片参考王喆《深度学习推荐系统》一书)
2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/35271.html