英特尔继续引领NAND技术创新
要说英特尔在NAND领域的技术创新,就不得不提其独特的浮栅架构。英特尔的浮栅架构是英特尔NAND最具差异化的可靠性技术,使得其QLC SSD的可靠性可以媲美TLC SSD。英特尔独特的浮动栅极技术可以实现业内领先的面密度,更小的单元尺寸,预计比替代性技术小大约15%。而且英特尔还拥有把控制逻辑电路放到内存阵列下的独特方法:阵列下CMOS。这两项技术结合起来,使得面密度比替代性产品高10%。这是因为阵列下CMOS不会浪费空间,从而可以在几乎每平方毫米晶圆上制造更多存储单元。
英特尔领先的Floating Gate(浮栅)技术,其采用经过充分验证的技术来解决3D NAND单元可靠性挑战。浮栅技术通过隧道氧化层控制电子流动。浮栅技术能够做到单元隔离,也就是电荷存储节点是隔离的。这种独特方法可以非常好地防止电荷丢失和单元间干扰。独特的垂直全环绕栅极结构可以让每个单元提供的电子数接近平面浮动栅极的6倍。更多电子意味着更高的控制力,更小的容差。更多电子容量还意味着可以让存储单元受到少量电子泄漏造成的电压变化的影响更低。
RWB (Read Window Budget,阈值电压窗口)指标对于NAND可靠性至关重要。RWB越大越好,出错概率越小。下图展示了1b/c一直到4b/c之间的差别,你会注意到位之间的差距越小,每个单元的位数越多。然而,如果看看下图右侧的图表——其中对比了浮动栅极单元和电荷捕获单元两种技术的RWB——可以看到浮栅单元的RWB高于电荷捕获技术。RWB越高,数据保留周期就越长,可靠性越好,从而也更容易实现4b/c, 5b/c等技术的产品化。英特尔浮栅技术的RWB非常卓越,这大大提升了QLC的数据维持能力,很好地加速QLC的商用化落地,并给后续的PLC等带来了曙光。
至于NAND的性能,英特尔最新采用了Block By Deck(BBD)和独立多平面读操作(IMPRO)两种提高性能的机制。
在BBD架构中,英特尔用虚拟层将每个Deck分开,每个Deck可以作为SLC或QLC运行。为了更有效地擦除区块,每块Deck可以被擦除而不触及存储在其他Deck上的数据。英特尔表示,这种方法对垃圾收集有极大的帮助,并能显著提高服务质量(QoS)。
英特尔还实施了一种新的独立多平面读操作(IMPRO)技术,通过将四个平面分割成可以异步读取的两个双平面组,使固态硬盘可以同时独立接收和执行读取命令,从而使读取操作的性能翻倍。IMPRO的异步性质会产生噪音耦合。为了减轻这种影响,英特尔配置了电荷泵、字线/位线调节器和降压(LDO)调节器,以驱动每个平面组中的独立负载。
这些独特技术的采用,可以持续提高英特尔 NAND的性能,从而改进SSD的性能和扩展性,也让英特尔继续保持在NAND技术的领先优势。特别是针对QLC新介质,英特尔更是提供了比业界同行更可靠,更快速的QLC SSD新品D5-P5316固态盘,让数据中心普遍采用QLC成为功能。
进一步提高可靠性
英特尔D5-P5316新品引领QLC在数据中心全面普及
数据正呈现出指数级增长,IDC 数据显示,全球数据量到 2025 年预计将增长至 175 ZB1。这一增长速度超乎想象,但我们不只面临数据量不断增长的挑战,还要确保更多 数据的可用性,保持数据的 “暖” 属性,将数据用于当前的关键业务应用,如分析、人工 智能(AI)、机器学习(ML)和内容交付网络(CDN)。例如,随着越来越多不同类型 的数据馈送到这些应用中,AI 和分析结果的准确性通常会随之提高。组织部署的大容量 存储需要为相关工作负载提供海量、且不断增长的温数据。
许多组织在其数据中心内部署了成本较低的机械硬盘(HDD),以满足不断增长的存储 容量需求。但机械硬盘无法满足现代工作负载对更快读取访问速度的需求。机械硬盘还 会占据数据中心的较大面积,因而会增加空间、电源、散热和替换方面的成本。
一些组织采取的策略是将较慢、较笨重的机械硬盘,更换为更快、更密集的三层单元 (TLC)NAND 固态盘(SSD)。TLC NAND 固态盘适用于混合和写入繁重的工作负 载,如高速缓存应用,但通常未经过成本和容量优化,难以满足以读取为中心的大规模 数据需求。
更切实可行的选择是用英特尔® QLC 3D NAND 固态盘替换机械硬盘,其兼具成本效益出 色的大容量和远超机械硬盘的读取性能。事实上,与机械硬盘相比,30.72TB 英特尔® 固态盘 D5-P5316 可将温数据存储的空间占用降低多达 20 倍。相比机械硬盘的持续 传输速率,英特尔 QLC 3D NAND 固态盘还可提供最高达 25 倍的顺序读取性能。而且 英特尔 QLC 3D NAND 固态盘还可提供密度优化与媲美 TLC 的读取性能,因而可帮助组 织大幅降低读取密集型存储工作负载的资本支出(CapEx)。
但是,很多人对QLC的可靠性还是保持怀疑态度,认为QLC目前主要用在消费级领域,在企业数据中心中使用还是有所担心。
其实,对于大多数现代工作负载部署,QLC NAND 固态盘可提供富余的耐用性,因为:• 英特尔QLC NAND的实际耐用性超出了传统认知和理论限制。• QLC NAND 固态盘具有更大的容量,能够将磨损分散到更大的区域。• 大多数固态盘在使用的全程,只会消耗一小部分额定的固态盘寿命。
1、实际耐用性与预期耐用性英特尔固态盘 D5-P5316 证明,QLC NAND 固态盘可以提供行业领先的耐用性水平。此外,QLC NAND 固态盘的真实耐用性在多个方面超出了预期。通过固态盘驱动控制器将写入均匀分布到盘上,可以避免一些单元受到反复冲击。大容量 QLC NAND 固态盘提供了更大的 “表面积” 来分配写入,从而减少整体退化。此外,对耐用性需求的认识与实际使用模式之间存在显著差距, 2020 年 2 月 USENIX 大会上公布的一项大规模研究对此进行了重点说明。该研究报告指出,实际应用下的耐用性要求通常远低于企业的预期。作者表示:“基于我们的数据,我们预测并认为,对于绝大多数企业用户来说,转向 QLC 在固态盘寿命上没有风险,因为 99% 的系统最多使用了其硬盘 15% 的额定寿命。”
2、大容量QLC NAND的寿命耐用性等于更小容量的TLC固态盘耐用性通常按照每日固态盘写入次数(DWPD)衡量, DWPD可测量在保修寿命内磁盘每日可写入的数据量。写入 TB 数(TBW)或写入 PB 数(PBW)也可用于表示耐用性,该指标可衡量在规定寿命内可写入磁盘的总数据量。磁盘的总耐用性取决于其容量。
例如,上图所示为一个 8TB TLC 固态盘(1DWPD,5年保修寿命),理论上可在 5 年内每天处理 8TB 的 数据写入。但请注意,额定 DWPD 为 0.25 的 5 年保修期 32TB QLC NAND 固态盘可写入该固态盘的数据总量与较小的 TLC 磁盘相同(32TB 容量乘以 0.25 DWPD)。
3、对于 NAND 固态盘耐用性,工作负载很重要面向不同应用场景的固态盘耐用性也取决于客户的使用模式和工作负载的性质。例如,如果应用依赖于小数据块的频繁随机写入,它将比大块数据的顺序读取更多地消耗 NAND 固态盘的寿命。这就是为什么 QLC NAND 固态盘适用于读取繁重的工作负载,这类工作负 载也需要大容量以快速访问更多数据。
此外,存储管理人员可以通过留出额外的硬盘空间来进一步提高有效耐用性。通过增加硬盘上的保留区域,将能够为有效的碎片整理和磨损均衡来留出更大的空 间,进而减少写入放大。
从上图英特尔固态盘D5-P5316的写入PB数对比,我们看到,如果提供20%的OP(超供),则写入量提高一倍以上。如果顺序写入,写入量有4倍以上的提升。
虽然针对读取性能进行了优化,QLC NAND 也适用于其他数据使用模式。凭借支持大数据块的充足写入性能,QLC NAND 能够支持某些细分市场的混合工作负载。
上图列出了 QLC NAND 非常适合的一系列工作负载(基于 I/O 模式)。
由于 QLC NAND 技术很复杂,因此业内许多人认为必须在数据 可靠性、数据保持和硬盘整体可靠性等方面进行妥协。但凭借三十年的浮栅架构经验,英特尔打造了一款毫无妥协的解决方案。英特尔 QLC 3D NAND 固态盘满足联合电子设备工程委员会 (JEDEC)的所有要求,相当于广泛采用的 TLC NAND 固态盘。
上表显示了英特尔 QLC NAND 固态盘与 TLC NAND 固态盘的比较情况。两者具有相同的故障率、不可纠正的位错误率(UBER)、 操作振动和温度范围,以及同样的 5 年保修。
写在后面
相信大家和我一样,从英特尔在2021中国闪存市场峰会的演讲上看到了英特尔 NAND的未来良好的发展前景。英特尔持续在NAND上的投入和创新,让英特尔的SSD将继续成为企业数据中心的首选。同时,英特尔的QLC SSD新品D5 P5316固态盘,具有和TLC SSD相当的可靠性和读性能,特别适合数据中心AI、ML等新型工作负载,必将加速QLC SSD在中国数据中心的普及。