如何用PostgreSQL解决一个人工智能语义去重的小问题
在云栖社区的问答区,有一位网友提到有一个问题:
表里相似数据太多,想删除相似度高的数据,有什么办法能实现吗?
例如:
银屑病怎么治?
银屑病怎么治疗?
银屑病怎么治疗好?
银屑病怎么能治疗好?
等等
解这个问题的思路.1. 首先如何判断内容的相似度,PostgreSQL中
PostgreSQL Oracle兼容性之 - 函数 自治事务 的实现
使用Oracle的用户,在函数中如果使用了自治事务的话,如果要转到PostgreSQL会遇到很棘手的问题。
因为PostgreSQL的函数是作为一个事务来处理的,要么全部提交,要么全部回滚,除了exception,每个exception是一个子事务。
使用exception确实可以达到类似自治事