北京2022年11月17日 /美通社/ -- 随着AI、大数据、物联网、云计算等新技术的发展和广泛应用,全球掀起了新一轮科技革命。各国为了推动经济发展,纷纷加大对工业互联网的投入力度,期望通过信息技术和制造业的深度融合,推动制造业向网络化、数字化、智能化、集约化方向发展。工业互联网是第四次工业革命的重要基石,通过工业互联网可以构建起覆盖全产业链、全价值链的全新制造和服务体系,结合中国制造业基础和产业结构,加速推进工业互联网建设将有利于推动中国工业和经济高速发展,早日实现制造业大国到制造业强国的转变。
工业互联网+大数据 利业惠民驱动数字经济飞速发展
随着中国工业领域信息化、数字化的深入和工业互联网的飞速发展,工业互联网大数据被广泛应用于工业生产经营的各流程和环节,数据量呈爆发式增长,数据价值迅猛提升,工业互联网大数据资源日益成为工业生产的核心要素。
中国工业互联网研究院(简称"工联院")自2019年起围绕"1+N"架构建设国家工业互联网大数据中心。其作用是对中国一二三产业全要素、全产业链、全价值链各项数据资源进行汇聚、处理、应用和配置,实现海量数据的搜集、存储、处理、应用和分发,构建成中国统一的工业互联网数据资源管理和服务体系,实现各地区、各行业数据资源的汇聚与智慧应用,有力支撑政府科学决策,为大中小企业赋能,促进实体经济高质量发展。
2020年新冠疫情初期,工信部依托工联院大数据中心等平台快速建成"国家重点医疗物资保障平台",运用信息化手段,保障重点医疗物资的科学调度、统筹管理和高效供应,汇聚医院、企业、政府等2800家单位防控物资需求,发布物资需求达5670多万件,实现了对1000万中小企业复产复工情况的精准监测。截止到2021年6月,国家工业互联网大数据中心共连接41家工业互联网平台、703万家企业,数据条目达到3.43亿条,云化部署工业APP 1130个,为"全国一盘棋"提供强有力的数据支撑。
工业互联网大数据应用 为数据基础设施带来挑战
国家工业互联网大数据中心支撑着数亿条数据的高效读写访问,其背后离不开存储系统可靠、高效的运行。同时,工业互联网大数据中心数据存储也面临巨大挑战:
其一,数据规模激增。国家工业互联网大数据中心是首个定位于全国、全领域的工业互联网大数据平台,数据量巨大,初期约30PB。随着入驻用户的增多,非结构化数据居多的数据量呈线性增长,这就要求存储系统具备PB级灵活扩容能力。
其二,数据并发提取性能要求高。大数据中心支持上百家工业互联网平台、千万家企业的数据接入和AI智能分析挖掘,并给各类生产经营提供决策指导,对整体决策的时效性要求非常高。
其三,数据面临多平台、跨区域的统一管理需求。大数据中心本次建设3个数据中心节点,主、备、分的全国范围数据平台基础架构,未来将打通全国各个省的工业互联网平台,数据将在多个平台实时共享。
最后数据需要实时精准检索、智能响应,并能够满足多种应用平台的接入和访问,实现数据要素价值的释放。
浪潮存储 四大法宝释放大数据价值
为保障国家工业互联网大数据中心数据访问过程更快、更准、更稳,浪潮存储基于228个AS13000分布式存储节点搭建主备两个中心,为首个国家级全国性工业互联网大数据平台打造坚实底座。浪潮通过快速交付和部署联调,提供了超30PB存储可用容量;还通过浪潮存储分布式软件的优化,保障了热数据的高性能调度响应,实现多平台跨区域集群、全国数十个数据中心统一管理。
首先,融合性。面对海量非结构化数据应用平台的复合性,浪潮分布式存储基于融合架构,一套存储可同时支持块、文件、对象、大数据四种存储服务,并实现文件、对象、大数据协议间互通互访,语义无损,实现数据的跨系统高效共享、采集、存储、分析与优化,全流程业务处理效率提升25%以上,IT投资运维成本节约30%以上,帮助国家工业互联网大数据中心节省大量TCO。
其次,高扩展性。浪潮分布式存储支持5120节点横向扩展,单一命名空间支持EB级容量,单一目录支持1000万文件,整个文件系统支持千亿级文件,容量和性能随节点增加线性增长,打破传统"烟囱"式存储系统瓶颈。浪潮存储系统通过堆叠扩展,实现分钟级单节点扩容,同时支持全局目录功能,扩容时新存储池直接加入原目录继续写入数据,实现上层应用无感知;同时,具备大规模节点批量自动化部署能力,可实现上百节点快速高效部署,帮助大数据中心应对海量数据激增带来的存储扩容难的挑战。
再次,高性能。浪潮分布式存储针对IO写入全流程进行深度优化,基于iTurbo智能加速引擎全面提升应用响应效率。浪潮存储基于多通道加速实现单客户端多通道链接,实现系统性能翻倍;基于智能资源调度实现CPU专核专用,将性能提升50%;内核客户端实现IO路径缩短50%,性能翻倍。此外,浪潮分布式存储支持自定义元数据标签和智能检索功能,文件读取更精准、更高效,实现百亿文件数量秒级检索,满足国家工业互联网大数据中心海量文件高效访问的需求。
最后,高可靠。浪潮分布式存储针对数据存储全生命周期提供多重可靠保障机制,为大数据中心提供生产级数据保护能力。比如,应用层可对数据进行快照、克隆等操作,多数据中心间能够实现同步/异步远程复制,构筑多站点同步容灾,有效消除单站点故障。又如,数据保护策略支持业内最大的副本和纠删比,可以灵活选择和组合使用;再如,数据强一致性校验可以保障数据写入内容完整,通过提前识别硬件、底软等位置由不易察觉的故障带来的数据错写,并进行告警和修复,从而保障数据写入高一致性。另外,浪潮存储的整个服务架构,基于4TB/H快速重构可以实现当出现存储系统故障时后台自动切换,而前端业务系统稳定运行没有任何卡顿;智能亚健康功能则实现对系统资源降级模式快速精准地检测并隔离,通过检测网络的丢包率和时延,多维度评测硬盘是否属于慢盘,针对CPU、内存是否超高占用进行自动检测,推动存储系统远离亚健康状态。
"工业是立国之本","制造业是国家经济命脉所系",增强制造产业发展新优势新动能,加快制造业的数字化改造,是中国实现高质量发展的重要途径。浪潮存储筑基国家工业互联网大数据中心,发挥工业大数据中枢的作用,为工业数据价值的深度挖掘保驾护航,助力中国实现从制造业大国到制造业强国的转变。