开发者社区> 问答> 正文

能否对采集的内容进一步筛选?

能否对采集的内容进一步筛选?

展开
收起
Puppet 2020-03-23 14:23:20 764 0
1 条回答
写回答
取消 提交回答
  • • 用户可以手动设定“过滤规则”,并可将文章列表中的批量内容提交至垃圾语料库(即手动标注为无效文章),通过机器学习,后续遇到该类内容时即可智能过滤。 • 智能过滤的效果取决于提交垃圾语料的数量,语料数量越多,过滤越准确。通常手动标注100篇左右的文章之后,系统自动过滤的准确性可以达到96%以上。 • 此外,过滤规则也可明确指定具体的关键词、作者或者某个源站,排除这些内容。

    2020-03-23 15:41:42
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
内容安全检测与管控 立即下载
《开放搜索查询分析服务架构分享》 立即下载
《开放搜索统一召回引擎实践》 立即下载