>>分享SPSS,Hadoop等大数据处理技术,以及分布式架构以及集群系统的构建 书籍支持  卫琴直播  品书摘要  在线测试  资源下载  联系我们
发表一个新主题 开启一个新投票 回复文章 您是本文章第 20472 个阅读者 刷新本主题
 * 贴子主题:  推荐系统的设计 回复文章 点赞(0)  收藏  
作者:sunshine    发表时间:2020-03-21 21:38:24     消息  查看  搜索  好友  邮件  复制  引用

                                                                                                

推荐系统的设计

1)推荐系统的要素

  • UI和UE(前端界面)
  • 数据(Lambda架构)
  • 业务知识
  • 算法

2)推荐系统架构

  •   推荐系统的整体架构

         点击在新窗口中浏览原图
CTRL+鼠标滚轮放大或缩小
  •   大数据Lambda架构
    •   Lambda架构是实时大数据处理框架
    •   Lambda架构将离线计算和实时计算整合,设计出一个能满足实时大数据系统关键特性的架构,包括有:高容错、低延时和可扩展等
      • 离线计算:数据量大、对时间要求不高的处理
      • 实时计算:数据量小、考虑时效性的处理
    •   分层架构
      • 批处理层
        • 数据不可变,可以进行任何计算,可水平扩展
        • 高延迟
        • 日志手机:Flume
        • 分布式存储:Hadoop
        • 分布式计算:Hadoop、Spark
        • 视图存储数据库
          • nosql(HBase/Cassandra)
          • Redis/memcache
          • MySQL
      • 实时处理层
        • 流式处理,持续计算
        • 存储和分析某个窗口期内的数据(热销排行)
        • 实时数据收集 flume & kafka
        • 实时数据分析 spark streaming/storm/flink
      • 服务层
        • 支持随机读
        • 需要在非常短的时间内返回结果
        • 读取批处理层和实时处理层结果并对归并
    •   Lambda架构图

           点击在新窗口中浏览原图
CTRL+鼠标滚轮放大或缩小
  •   推荐算法架构
    •   召回

           就是从海量数据中选择少部分数据
      • 召回决定了最终推荐结果的上限
      • 常用算法:
        • 协同过滤
        • 基于内容
    •   排序阶段

           对召回中的数据进行排序,得到少部分数据
      • 召回决定了推荐结果上限,排序逼近这个极限,决定了最终推荐结果
      • CTR预估(点击率预估 LR算法)估计用户是否会点击某个商品
    •   策略调整

           点击在新窗口中浏览原图
CTRL+鼠标滚轮放大或缩小
               ----------------------------
原文链接:https://blog.csdn.net/WangTaoTao_/article/details/104246505

程序猿的技术大观园:www.javathinker.net



[这个贴子最后由 flybird 在 2020-03-21 21:38:24 重新编辑]
  Java面向对象编程-->Java常用类(下)
  JavaWeb开发-->Web运作原理(Ⅰ)
  JSP与Hibernate开发-->Java应用分层架构及软件模型
  Java网络编程-->通过JavaMail API收发邮件
  精通Spring-->Vue简介
  Vue3开发-->通过Axios访问服务器
  大数据存储单位介绍(TB、PB、EB、ZB、YB有多大)
  基于spark-streaming实时推荐系统
  glusterfs 7 分布式存储 目前最新版实战详解
  playbook自动安装kafka集群
  Spark RDD转换成DataFrame的两种方式
  hadoop从零开始--HDFS篇
  SDN网络IPv6组播机制支持实时视频业务海量用户扩展
  Flume+Kafka+Storm+Redis构建大数据实时处理系统:实时统计网...
  超详细的Hadoop2配置详解
  大数据项目之仿天猫数据分析
  云计算和大数据到底有什么关系
  数据仓库的两种建模方法
  深入理解MapReduce的架构和原理
  MapReduce工作原理图文详解
  Hadoop的安装和基本操作命令
  更多...
 IPIP: 已设置保密
楼主      
1页 0条记录 当前第1
发表一个新主题 开启一个新投票 回复文章


中文版权所有: JavaThinker技术网站 Copyright 2016-2026 沪ICP备16029593号-2
荟萃Java程序员智慧的结晶,分享交流Java前沿技术。  联系我们
如有技术文章涉及侵权,请与本站管理员联系。