将分类模型输出的置信度prob 作为确定分类结果的参考依据,高于某一阈值则认为匹配到某个分类。这一方法具有经验意义,实践中有效的屏蔽了大部分OOD 错误。
对于算法模型的部分OOD 误判,我们可以通过逻辑关系来辨别。如我们认为DSL 树的同一条路径上不可能有多个相同组件(否则形成自嵌套),如果该路径上识别出多个相同组件,那么我们通过置信度大小来选择识别结果。此类逻辑帮我们筛选了大部分误判。
提供的反馈服务,允许用户将识别错误的DSL 上传,上传后增强为一定数量的负样本并存储。在此基础上重新训练,可以解决OOD 问题。
目前OOD 问题还是依赖逻辑和反馈的方法来规避,算法层面仍然没有解决该问题,这是我们下一阶段计划去做的事。
算法平台支持将模型部署为线上接口,即预测服务,通过imgcook 平台可一键调用部署。为了实现自动化训练、部署的流程,我们还做了一系列算法工程的工作,在此不作详述。
以上内容摘自《前端代码是怎样智能生成的》电子书,点击https://developer.aliyun.com/topic/download?id=53可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。