备案控制台

开发者社区> 问答> 正文

SQL查找重复条目（在组内）

我有一个小问题，我不确定修复它的最佳方法是什么，因为我对数据库（Oracle）本身的访问有限。在我们的表“ EVENT”中，我们大约有16万个条目，每个EVENT都有一个GROUPID，一个普通条目恰好有5行具有相同的GROUPID。由于一个错误，我们目前有几个重复的条目（重复，所以10行而不是5行，只是一个不同的EVENTID。这可能会改变，所以只是<> 5）。我们需要过滤这些组的所有条目。

由于对数据库的访问受到限制，我们不能使用临时表，也不能向GROUPID列添加索引以使其更快。

我们可以通过此查询获取GROUPID，但是需要第二个查询才能获取所需的数据

select A."GROUPID" from "EVENT" A group by A."GROUPID" having count(A."GROUPID") <> 5 一种解决方案是子选择：

select * from "EVENT" A where A."GROUPID" IN ( select B."GROUPID" from "EVENT" B group by B."GROUPID" having count(B."GROUPID") <> 5 ) 如果没有GROUPID和16万个条目的索引，这将花费很长时间。尝试过考虑可以解决此问题的联接，但到目前为止仍找不到好的解决方案。

有人可以为此找到一个好的解决方案吗？

小修改：我们这里没有100％的重复项，因为每个条目仍然具有唯一的ID，GROUPID也不唯一（这就是为什么我们需要使用“ group by”的原因）-也许我只是想念一个简单的解决方案它:)

关于数据的小例子（我不想删除它，只是找到它）

EVENTID | GROUPID | TYPEID

123456 123 12

123457 123 145

123458 123 2612

123459 123 41

123460 123 238

234567 123 12

234568 123 145

234569 123 2612

234570 123 41

234571 123 238

它还有更多列，例如时间戳记等，但是正如您已经看到的那样，除了EVENTID之外，其他所有内容都是相同的。

我们将更频繁地运行它进行测试，以发现错误并检查是否再次发生。

问题来源于stack overflow

展开

收起

保持可爱mmm 2019-11-18 17:04:00 401 0

1 条回答

写回答

取消提交回答

保持可爱mmm

您可以通过联接而不是子查询来获得答案

select a.* from event as a inner join (select groupid from event group by groupid having count(*) <> 5) as b on a.groupid = b.groupid 这是从组中的行中获取所有信息的相当普遍的方式。

像您建议的答案和其他响应一样，使用groupid上的索引可以更快地运行。由DBA权衡使查询运行得更快的好处与维护另一个索引的成本之间的平衡。

如果DBA决定反对索引，请确保适当的人员了解其索引策略，而不是您编写使速度变慢的查询的方式。

2019-11-18 17:04:09

赞同展开评论打赏

问答分类：

SQL 数据库索引

问答标签：

SQL重复 SQL查找

问答地址：

开发者社区 > 数据库 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

表格储存中目前SQL支持虚拟列查找吗？

450

1

0

各位，使用 Table API 执行一个从多个表获取数据的SQL，打印后发现很多重复的数据，这个是

1142

1

0

我想在数仓的几百个节点里面查找一个都有哪些sql里面用到了某张表能查吗

342

1

0

数仓当中如何查找和删除表中的重复数据？给出方法或SQL。？

733

1

0

Sqoop中sql语句如何查找导入hdfs？

468

1

0

SQL中去除重复的关键字是哪个呢？

611

1

0

如何用SQL查找redo日志文件所在服务器目录？

874

1

0

如何查找SQL clob大字段中是否包含某个字符串内容？

1372

1

0

MySQL中怎么用SQL将一个字符串重复6次再次组成新的字符串？

771

1

0

怎么解决数据库SQL高并发业务场景下缓存和数据库一致性问题？比如：数据重复插入问题

1004

2

0

问答排行榜

最热

最新

1 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818963

2 据说在家办公的程序员是这样写代码的？ 1793079

3 阿里云开放端口权限 690240

4 如何升级配置 536276

5 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522811

6 【精品问答】python技术1000问(1) 514118

7 Flink Forward Asia 2021 有奖问答 512896

8 OceanBase 使用动画（持续更新） 359367

9 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329799

10 OSS存储服务-客户端工具 321544

11 为体验实验室取一个新名字。 307468

12 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 304071

13 Win Server 2003-2016 加密勒索事件必打补丁合集 295322

14 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 284175

15 安全组详解，新手必看教程 277337

16 写code还是做管理，开发者如何进行职业规划？ 269108

17 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255878

18 阿里云手机和阿云浏览器连接问题专帖 235686

19 支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】 226457

20 请问阿里云邮箱如何开启SMTP服务啊！ 225845

1 “云+AI”能够孵化出多少可能？ 282

2 当AI频繁生成虚假信息，我们还能轻信大模型吗？ 124

3 FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？ 724

4 AI时代，存力or算力哪一个更关键？ 920

5 求宜搭关联表单的更新方法！！！ 144

6 全网寻找 #六边形战士# 程序员，你的 AI 编码助手身份标签是什么？ 1040

7 老哥们有个需求想请教一下，十分感谢 135

8 关于“通义灵码”而言，这次更新后，他更加人性化，然而我更喜欢fittencode,理由如下 126

9 关于开发者的100件小事，你知道哪些？ 1073

10 AI助力，短剧迎来创新热潮？ 687

11 "ModelScope默认的下载位置是在哪里？ 283

12 1024程序员节，开发者们都在参与社区的哪些活动？ 2350

13 关于文本框校验自定义函数的问题 395

14 执行docker search nginx 报错超时 289

15 百问求答第四期-回答问题即有机会拿冬季取暖器 1044

16 宜搭-集成&自动化，怎么实现定时自动获取普通表单里的所有数据，并更新该表单里的某列数据？ 278

17 有没有大佬知道：宜搭的流程表单里如何通过js面板给成员组件赋值？ 357

18 百问求答第四期-回答问题即有机会拿冬季取暖器 784

19 域名内网可以正常访问，外网访问不了 434

20 普通人能用阿里云做什么？ 266

相关课程

更多

如何在 PolarDB-X 中优化慢 SQL

130

2

去学习

SQL完全自学手册

3870

61

去学习

SQL Server on Linux入门教程

4392

14

去学习

SQL入门与实践

11450

6

去学习

数据库及SQL/MySQL基础

6952

22

去学习

SQL进阶及查询

2573

25

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

SQL Server 2017 立即下载

GeoMesa on Spark SQL 立即下载

原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载

相关实验场景

更多