02-在 Kuber SocialBadge 基础上再前进一步

简介:

Kuber 的 SocialBadge 能够根据给出的 Email地址、Twitter用户主页地址、Google User Profile地址等得到:

  • 此人的 Google Reader Shared Items URL(如果有的话);
  • 此人关注哪些人(Twitter、Google Reader等里面的Followings)。

 

测试连接:

1、我的google profile 链接:http://kuber.appspot.com/social/search?q=www.google.com%2Fprofiles%2Fzhengyun

2、我的twitter链接:http://kuber.appspot.com/social/search?q=twitter.com%2Fzhengyun

 

在此基础之上,我希望:

1、给定若干高权重的、社会化媒体重度使用者的 Twitter帐号或Google Profile地址;此用户集合我们称之为:TargetUsers。

2、分别获取每个人的关注列表(此人都关注哪些节点(Node)),此用户集合称为:FollowingNodes。合并重复后,得到一个总的节点集合,称之为:WatchList。

3、针对 WatchList 的每一个Node,遍历之:

检查它对应的Web服务我们是否支持。我们目前暂定支持 Google Reader Shared Items、Twitter、delicious(这些都有链接或短消息)。确定该数据是否有权访问。如果对方未开放权限(访问会得到403状态码),就忽略。

异步收集该Node的数据。如果是GoogleReader就收集它分享的每一篇文章。如果是Twitter,就收集它发布的RT消息和带HTTP链接的消息。如果是delicious,就收集它的收藏链接。

4、针对TargetUsers的每一个用户,逐一计算他关注的世界(FollowingNodes)中:

  • 大家分享最多的文章或链接,仿照SR的算法;
  • 大家转发最多的Twitter消息,仿照锐推榜的算法。

 

目的是:

  • 观察在现有中国社会化媒体使用情况下,个性化计算是否能满足阅读需求。
  • 观察对于收集到的社会化媒体重度使用者,他们所关注的世界的热文和热推是否有价值,对于一般用户来说。
目录
相关文章
|
自然语言处理 算法 数据挖掘
自蒸馏:一种简单高效的优化方式
背景知识蒸馏(knowledge distillation)指的是将预训练好的教师模型的知识通过蒸馏的方式迁移至学生模型,一般来说,教师模型会比学生模型网络容量更大,模型结构更复杂。对于学生而言,主要增益信息来自于更强的模型产出的带有更多可信信息的soft_label。例如下右图中,两个“2”对应的hard_label都是一样的,即0-9分类中,仅“2”类别对应概率为1.0,而soft_label
自蒸馏:一种简单高效的优化方式
|
3月前
|
数据采集 自然语言处理 算法
|
3月前
|
C语言
2.5进一步使用C
该程序首先通过注释说明了文件名及程序目的,展示程序说明的必要性。接着,它在同一行内声明了两个变量`feet`和`fathoms`,简化代码结构。随后,利用C语言中的乘法运算符`*`进行简单数学运算,将`fathoms`变量值乘以6并赋给`feet`。最后,使用`printf()`函数以新颖的方式输出多个值,展示了如何在单次调用中打印不同内容。
49 6
|
5月前
|
自动驾驶 安全 物联网
5G网络:速度之外的优势深度解析
【8月更文挑战第5天】综上所述,5G网络的优势远不止于其惊人的速度。其超低时延、大规模连接能力、高可靠性和稳定性、灵活频谱利用以及创新的网络切片技术等优势共同构建了一个全新的智能世界。在这个世界里,万物皆可互联、实时交互成为可能,关键业务应用得到可靠保障,频谱资源得到高效利用,网络资源实现高度定制化。5G网络正以前所未有的方式改变着我们的生活和工作方式,引领着未来的智能生活与社会创新。
|
6月前
|
机器学习/深度学习 自然语言处理 算法
大模型技术基础
【7月更文挑战第26天】大模型技术基础
138 6
|
8月前
|
人工智能 大数据 5G
400G光模块已经部署,需求将进一步扩大
2023年底,电信运营商完成400G OTN试验网设备部署,标志着400G技术大规模部署的开端。400G传输技术日趋成熟,预计2024年实现长距离商用。400G光模块在提升数据传输效率、降低能耗方面发挥关键作用,适应云计算、大数据、AI对高效算力的需求。光纤技术行业显现复苏态势,400G光模块部署成为数据中心发展的必然,支持新兴技术发展。随着5G、云计算等技术进步,对高速光模块需求激增,推动光纤行业创新与市场扩张。
89 2
|
8月前
|
存储 缓存 安全
【C/C++ 项目优化实战】 分享几种基础且高效的策略优化和提升代码性能
【C/C++ 项目优化实战】 分享几种基础且高效的策略优化和提升代码性能
411 0
|
XML 数据格式
进一步了解XPath
进一步了解XPath
|
机器学习/深度学习 数据采集 自然语言处理
高级能力和算法效果优化 | 学习笔记
简介:快速学习高级能力和算法效果优化
202 0
高级能力和算法效果优化 | 学习笔记