在线电视剧的受众竞争力预测和分析 | KDD论文解读

简介: 目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。

作者:张鹏,刘传仁,宁克锋,祝文祥,张宇

目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。
问题定义:
目前学术界并没有定义过剧目之间的竞争力,我们在调研过竞争力相关的文章后提出了一种剧目竞争力的定义。首先我们通过统计用户的观看次数,然后计算出两两剧目之间对用户观看次数的相对占有量,最后对所有用户取平均作为最终的竞争力。
我们以周为单位计算得到竞争力,进一步可以构建成为竞争网络图,图的节点为剧目,边是竞争力,这张竞争网络图是动态的,随着时间推移不断变化,而我们要预测的是未来网络图中每条边的数值,也就是剧目之间的竞争关系。下图是动态竞争网络的示意图,在已知T-2、T-1、T时刻的竞争网络,要预测T+1时刻的竞争网络。值得注意的是,动态竞争网络中的剧目不是一成不变的,旧剧往往在大结局之后一段时间会消失,而新剧在首播时会出现。
image.png

算法设计:

针对上述问题,我们结合深度神经网络和知识库系统设计了一种动态深度网络分解框架,并命名为Dynamic Deep Network Factorization (DDNF)。该框架可充分融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。框架共分为三个部分:第一部分是时序模块(Temporal Latent Factors),该模块利用张量分解从竞争网络中学习到剧目的时序隐含表征;第二部分是深度静态特征模块(Deep Embedding of Static Features),该模块利用知识库(KB)和深度神经网络(DNN)从静态特征中抽取剧目的关系和属性信息,静态特征主要包括了剧目的简介、题材、制作人员关系等;第三部分是循环动态特征模块(Recurrent Embedding of Dynamic Features),该模块利用长短期记忆网络(LSTM)从剧目的动态特征中抽取剧目的动态变化信息,动态特征包括了剧目每天的观看次数、点赞人数、更新状态等。最终将三个模块组合在一起,形成端到端的动态深度网络分解框架,示意图如下,绿色框表示时序模块,黄色框表示深度静态特征模块,紫色框表示循环动态特征模块。

image.png

实验对比:

我们利用某大型网络视频平台的历史数据,构建了剧目竞争力数据集,并利用该数据集进行实验。数据集包括了电视剧与综艺两个数据集,时间跨度为一年。同时,我们选取了经典矩阵分解算法PMF、时序矩阵分解算法BTMF、考虑额外信息的矩阵分解算法HBMFSI以及兼具时序和额外信息的ETF进行了对比,实验结果表明,我们的算法DDNF在两个数据集上都取得了最好的效果,同时,发现对于新剧的竞争力预估,DDNF表现更加突出。

image.png

总结:

针对网络电视剧目,本文首次提出了受众竞争力的建模和动态预测问题。论文首先通过挖掘剧目的观看记录构建一系列动态的竞争网络,然后结合深度神经网络和知识库系统设计了动态深度网络分解框架。该框架可以融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。通过预测剧目之间的竞争力刻画剧目的受众,对于视频平台的广告售卖、剧目采购计划、以及与其它平台的合作和竞争等决策任务。

更多数据挖掘内容查看:《KDD论文精华解读》

相关文章
|
Ubuntu Linux
查看Linux系统架构的命令,查看linux系统是哪种架构:AMD、ARM、x86、x86_64、pcc 或 查看Ubuntu的版本号
查看Linux系统架构的命令,查看linux系统是哪种架构:AMD、ARM、x86、x86_64、pcc 或 查看Ubuntu的版本号
3643 4
|
Java 数据库连接
SpringBoot配置多数据源实战
第四届光学与机器视觉国际学术会议(ICOMV 2025) 2025 4th International Conference on Optics and Machine Vision
674 8
|
人工智能 自然语言处理 API
[AI Meta Llama-3.1] 介绍
探索Meta Llama-3.1 AI模型的强大功能,包括多版本选择、关键能力、自定义部署和成本优化策略。
[AI Meta Llama-3.1] 介绍
|
存储 搜索推荐 大数据
大数据在医疗领域的应用
大数据在医疗领域有广泛应用,包括电子病历的数字化管理和共享,提升医疗服务效率与协同性;通过数据分析支持医疗决策,制定个性化治疗方案;预测疾病风险并提供预防措施;在精准医疗中深度分析患者基因组信息,实现高效治疗;在药物研发中,加速疗效和副作用发现,提高临床试验效率。此外,在金融领域,大数据的“4V”特性助力业务决策前瞻性,被广泛应用于银行、证券和保险的风险评估、市场分析及个性化服务中,提升运营效率和客户满意度。
1459 6
|
Ubuntu Python
ubuntu build install python3.12 and config pip
该脚本用于在 Ubuntu 上编译安装 Python 3.12,并配置 pip 使用国内镜像源。主要步骤包括安装依赖、下载并解压 Python 源码、编译安装、创建符号链接、配置 pip 源,以及验证安装和更新 pip。通过运行此脚本,可以快速完成 Python 3.12 的安装和配置。
1489 0
|
机器学习/深度学习 自然语言处理 PyTorch
【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解
【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解
936 0
|
人工智能 API 开发者
【AI大模型应用开发】0.2 智谱AI API接入详细步骤和简单应用
【AI大模型应用开发】0.2 智谱AI API接入详细步骤和简单应用
3122 0
|
SQL Java 数据库连接
ORM框架的发展历史
最初的时候是直接通过jdbc来直接操作数据库的,如果本地数据库有一张t_user表,那么操作流程是
360 0
|
XML 测试技术 网络安全
开发工具:USB转IIC/I2C/SPI/UART适配器模块可编程开发板
总的思路是通过USB或者UART接口发送一些协议字符串,由模块转换成上面几种接口的硬件时序电信号,实现与这几种接口芯片、设备的快速测试。 首先声明一下,大家都是搞硬件开发的,这几种接口当然是很简单的事,但有些时候对于一个新的设备或者芯片的测试,有个现成的工具当然更顺手,节省时间,也更可靠嘛。
|
存储 算法 搜索推荐
排序算法的复杂度及稳定性详解(内含记忆小窍门)
排序算法的复杂度及稳定性详解(内含记忆小窍门)
排序算法的复杂度及稳定性详解(内含记忆小窍门)