每年14PB数据存储需求,海量交通安全数据如何安放?

简介:



中国汽车工业协会统计分析,2016年8月,在商用车主要品种中,与上月相比,客车和货车产销均呈增长,货车产销22.26万辆和23.25万辆,环比增长9.15%和10.21%,同比增长20.51%和15.37%。


而远程被管理车辆每天大约需要上传20MB左右的数据。按照100万辆计算,每月大约600TB,每年7.2PB左右。100万辆车对数据中心的存储需求大约在14PB。


面对不断增长的数据,对商用车纳入远程监控管理和提供远程信息服务的要求日益提高。相关交通运输行业作为传统行业的“老大哥”,在大数据时代的背景下,面临海量交通安全数据的处理,转型势在必行。对基础架构技术进行革新,配合上层软件解决方案的软硬件结合的模式将重塑高效、安全的交通运输业未来。


海量数据存储、实时分析

中交兴路智能车货匹配案例


北京中交兴路信息科技有限公司(以下简称“中交兴路”)是一家专注于商用车车联网领域的运营和服务商,提供安全、运行稳定可靠的完整车联网信息服务解决方案


传统方案将数据的采集和存储作为前端任务,而将数据的分析作为后端任务。各种传感器技术的应用造成数据种类复杂多样,非结构化数据所占比重快速上升,海量增长的数据也对网络传输和后端处理能力造成很大的压力。



远程被管理车辆每天大约需要上传20MB左右的数据。按照100万辆计算,每月大约600TB,每年7.2PB左右。根据政府监管和中交兴路其它增值服务需求(一年两份冗余),100万辆车对数据中心的存储需求大约在14PB。


面对如此海量的数据,中交兴路首先需要将数据的访问和存储等服务从硬件资源池中分离出来,使数据访问脱离硬件以面对新型存储设备和存储容量扩充等需求,此外中交兴路还需要考虑存储系统的性能和带宽以应对百万级车辆同时上传数据的需求。


打造智慧交通

“芯”方案


如此一来,增强数据存储能力,提高大数据处理和分析性能成为关键。作为国内领先商用车车联网服务商和全国性道路货运车辆公共监管与服务平台的供应商,中交兴路与英特尔合作,配合英特尔架构计算平台的领先优势,部署用以应对海量数据的采集、存储和分析等业务对数据中心的性能需求。


目前,中交兴路大数据平台可以满足现有百万级车辆的10PB级数据存储能力和存储性能需求,并可灵活扩展以应对更多车辆数据的存储挑战。与此同时,相应的车联网解决方案对大量车载终端海量实时数据及时采集、处理、存储和分析,同时支持大规模终端用户实时查看、分析、监控和处理实时业务,并可伴随业务规模的增长而动态扩充平台性能以满足业务需求。


中交兴路大数据中心利用分布式处理的软件框架ApacheHadoop/HBase和基于英特尔至强处理器E5系列的服务器实现百万级别车辆数据的存储、查询、分析和统计。底层架构使用英特尔至强处理器E7系列的出色性能和大内存支持等特性实现数据的实时分析和处理,并轻松实现计算性能的扩展,用以支持更高的计算密度和增强的虚拟化等特性,使得中交兴路大数据平台成为理想的云计算技术运行平台。


针对中交兴路车联网平台百万级车辆管理的业务需求,中交兴路和英特尔还一起研发实施了英特尔架构的硬件平台和第三方商业、开源软件相结合,基于云计算和大数据处理技术的车联网平台压力测试。压力测试方案模拟可以10万、30万、50 万车辆的位置和告警(如超速、疲劳驾驶),持续运行1小时。目前,中交兴路大数据中心既服务于中交各业务和产品线,也服务于整个货运生态;针对合作企业需求,通过数据开放平台,提供数据分析、趋势预测、用户行为画像、区域分析、咨询报告等服务。


“芯”动力

“芯”可能


中交兴路车联网大数据平台通过实现PB 级海量数据的集中存储和管理,满足车联网业务需求。该平台帮助确保车辆安全保障和实时护驾,通过实时获取车辆各项状态及信息数据实现实时管控,高效安全进行车货匹配,创新了行业商业模式,为行业发展转型奠定了基础。


基于英特尔架构的解决方案,凭借其高性能、可扩展性、灵活性、安全性等优势而构建起了包括存储、网络、计算在内的下一代数据中心架构,完美地支持了未来车联网发展和行业业务需求,而这一切只是英特尔助力交通运输行业转型、企业业务升级的一个“小”体现的缩影。

原文发布时间为:2017-03-28

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
Kubernetes 关系型数据库 MySQL
ChaosBlade常见问题之数据库进行故障注入报错ibdata1文件异常如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
480 1
|
安全 Shell 网络安全
基于Vulnhub靶场—DC4渗透测试过程
Vulhub是一个开源项目,专注于安全漏洞的复现和学习。包括Web应用、容器和操作系统漏洞。项目特点包括丰富的漏洞场景、详细的复现指南、便捷的环境部署和持续更新。通过Vulhub,安全从业者可以学习和研究漏洞利用技术。此外,文章还介绍了如何下载和搭建Vulhub靶机DC-4,并详细描述了利用Burp Suite进行密码爆破和命令执行,最终获取root权限的过程。
1421 0
|
前端开发 JavaScript Java
现代化软件开发中的前后端分离模式
随着互联网技术的快速发展,现代化软件开发中的前后端分离模式逐渐成为主流。本文将介绍前后端分离的概念和优势,以及如何在不同的技术栈中实现这种模式。通过前后端分离,可以提高开发效率、降低耦合性,并且更好地满足用户需求。
894 0
|
机器学习/深度学习 人工智能 自然语言处理
【AI系统】推理系统引言
本文深入探讨了推理系统与推理引擎的概念及其实现方法,涵盖模型小型化、离线优化压缩、在线部署与优化等多个方面。通过具体应用实例,如人脸Landmark识别、人脸检测与手势识别等,展示了推理系统在实际场景中的强大功能。同时,文章还讨论了维护推理系统时需考虑的关键问题,包括API设计、数据质量保障、网络延迟优化等,为读者提供了全面的理论与实践指南。
477 6
|
12月前
|
机器学习/深度学习 人工智能 安全
通义视觉推理大模型QVQ-72B-preview重磅上线
Qwen团队推出了新成员QVQ-72B-preview,这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色,尤其在数学推理任务中取得了显著进步。尽管如此,该模型仍存在一些局限性,仍在学习和完善中。
2250 51
|
SQL 数据可视化 安全
微软SQL Server可视化工具与技巧
微软SQL Server不仅提供了强大的数据库管理功能,还集成了多种可视化工具,帮助用户更直观地理解和管理数据
1096 5
|
自然语言处理 监控 关系型数据库
MySQL模糊匹配技巧:无需ES的高效实现
在数据库应用中,模糊匹配是一个常见的需求,尤其是在不引入Elasticsearch(ES)等外部搜索引擎的情况下。MySQL作为强大的关系型数据库,提供了多种实现模糊匹配的方法。本文将分享如何在MySQL中实现模糊匹配,并提供五大步骤和十个实战案例,帮助你提升查询效率和性能。
1437 1
|
安全 数据挖掘
服务器数据恢复—RAID5阵列中两块硬盘离线导致阵列崩溃的数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中一块硬盘未知原因离线,热备盘自动激活上线替换离线硬盘。在热备盘上线过程中,raid5阵列中又有一块硬盘离线。热备盘同步失败,该raid阵列崩溃,LVM结构变得不完整,文件系统无法正常使用。
|
关系型数据库 分布式数据库 数据库
PolarDB,阿里云的开源分布式数据库,与微服务相结合,提供灵活扩展和高效管理解决方案。
【7月更文挑战第3天】PolarDB,阿里云的开源分布式数据库,与微服务相结合,提供灵活扩展和高效管理解决方案。通过数据分片和水平扩展支持微服务弹性,保证高可用性,且兼容MySQL协议,简化集成。示例展示了如何使用Spring Boot配置PolarDB,实现服务动态扩展。PolarDB缓解了微服务数据库挑战,加速了开发部署,为云原生应用奠定基础。
618 3
|
关系型数据库 MySQL Java