开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

针对小红书实时推荐算法训练,Flink 对一个 Summary 的标签数据有哪些实时处理路径?

已解决

针对小红书实时推荐算法训练,Flink 对一个 Summary 的标签数据有哪些实时处理路径?

展开
收起
游客lmkkns5ck6auu 2022-08-31 10:56:01 573 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    • 首先,Summary 标签数据会和推荐引擎推荐出来笔记的特征数据进行关联,这个关联也是在 Flink 任务中进行的,内部称其为 FeatureJoiner 任务。接着会产出一个算法训练的样本,这个样本经过算法训练之 后产出一个推荐模型,而这个模型最终会反馈到实时推荐引擎中;

    • 其次,Summary 标签数据会通过 Flink 实时写到 OLAP 引擎中,比如写到 Hologres 或 Clickhouse 中;

    • 最后, Summary 标签数据会通过 Flink 写入到离线 Hive 表中,提供给后续离线报表使用。

    以上内容摘自《Apache Flink 案例集(2022版)》电子书,点击https://developer.aliyun.com/ebook/download/7718 可下载完整版

    2022-08-31 13:01:21
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载