开发者社区> 问答> 正文

关于nosql中的数据冗余问题

最近在设计一个对资源要求很高的模块的时候,为了灵活性参考了nosql的实现,但是发现value中经常要重复保存很多在关系数据库中类似字段名称的信息。这样冗余度看起来很大。举个例子吧。

关系数据库中:

id acolumn bcolumn ccolumn dcolumn

1 aaa bbb ccc ddd

2 eee fff ggg hhh

k/v数据库中:

k v

1 {"acolumn":aaa, "bcolumn":bbb, "ccolumn":ccc, "dcolumn":ddd}

1 {"acolumn":eee, "bcolumn":fff, "ccolumn":ggg, "dcolumn":hhh}

以此类推,可见在k/v模型中会产生很多的字段名称数据冗余,因为这些数据都是要在线查询的,所以压缩技术不好应用上去。请问有没有什么比较合适的方式既能有比较好的灵活性,又能尽量避免冗余呢?

运行环境是一个单机系统,需要添加索引帮助快速查询,但不用考虑过多并发。

下面是想到的一个比较折衷的办法:

在数据表里建立足够多的列,列名没有业务意义,类似c1,c2,c3等,然后再在另一表中存储字段信息,比如{'account':'c1', 'address':'c2'}等,然后查询的时候先查列名对应的列,然后再组成sql语句查出最后的结果。

这样可能需要一个适合稀疏数据表的数据库引擎。请问有什么好的推荐吗。

或者这样的设计合理吗?有更直接的解决方式吗?各位看官,先谢谢了。

展开
收起
a123456678 2016-06-28 17:53:47 3391 0
1 条回答
写回答
取消 提交回答
  • 这种情况建议用mongo。把这个当做一个document来存。里面的字段可以是不同结构的。
    另一般情况

    另外kv数据库 本来关联查询本就是个难题。

    如果又要能单条件(key)查询的速度,又要能关联查询。那么冗余是必不可少的。

    同时,如果不用冗余话。那就必须得多次查询,这样为了保证数据查询速度,所以又得用分布式。

    2019-07-17 19:48:35
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
DTCC 2022大会集锦《云原生一站式数据库技术与实践》 立即下载
阿里云瑶池数据库精要2022版 立即下载
2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载