如何用PostgreSQL解决一个人工智能语义去重的小问题
在云栖社区的问答区,有一位网友提到有一个问题:
表里相似数据太多,想删除相似度高的数据,有什么办法能实现吗?
例如:
银屑病怎么治?
银屑病怎么治疗?
银屑病怎么治疗好?
银屑病怎么能治疗好?
等等
解这个问题的思路.1. 首先如何判断内容的相似度,PostgreSQL中
阿里云发布POLARDB的背后,未来3年无自研数据库的云计算玩家将被淘汰
本文讲的是阿里云发布POLARDB的背后,未来3年无自研数据库的云计算玩家将被淘汰,近日,阿里云正式对外发布了全新一代自研关系型数据库POLARDB。值得注意的是,POLARDB并不是基于开源数据库MySQL之上研发的分支,而且基于第三代分布式共享存储架构,创新实现企业级OLTP与OLAP一体化数据库系统整体设计。
是如何做到系统无缝迁移的? 褚霸详解阿里云数据库架构演进和实践
阿里云数据库从最初的只支持MySQL,到现在支持关系数据库、NoSQL、HTAP、EMR产品体系,在管控系统和数据链路上做了好几次重大架构迭代,云产品很长的生命周期里面会遇到新老架构共存,做到架构连续和系统无缝迁移是个很大的挑战, 本文将为你分享云数据库架构演进和实践。
数据库优化器原理 - 如何治疗选择综合症
标签
PostgreSQL , 单列索引 , 复合索引 , 优化器 , 成本因子
背景
RBO -> CBO -> 动态优化
经常听到这样的声音:“查询慢?加个索引吧。”,虽然话不专业,但是体现了早期基于RBO(基于规则)的优化器思维。
PostgreSQL何以支持丰富的NoSQL特性?
一、引言
上篇文章 介绍了PostgreSQL的典型高级SQL特性,PostgreSQL不仅是关系型数据库,同时支持丰富的NoSQL特性,本文将从 《PostgreSQL实战》 一书的“ 第9章 PostgreSQL的NoSQL特性”中摘选部分内容介绍。
谈谈互联网后端基础设施
对于一个互联网企业,后端服务是必不可少的一个组成部分。抛开业务应用来说,往下的基础服务设施做到哪些才能够保证业务的稳定可靠、易维护、高可用呢?