应用

技术

物联网世界 >> 解决方案 >> 物联网方案
企业注册个人注册登录

浪潮云海大数据一体机助力湖北省工商行政管理局信息化建设

  工商登记制度改革信息化建设总体包括企业信用信息公示系统建设、对现有业务系统优化完善、电子营业执照系统建设三个部分。其中企业信用信息公示系统建设由全国企业信用信息公示系统和由各省级、总局本级公示系统两级组成;对现有企业登记和监督管理系统的优化完善包括对业务系统的改造、全程电子化改造、对数据中心的改造和对公共服务网站的改造;电子营业执照建设包括总局电子营业执照系统建设和省市级工商行政管理部门以总局根系统为信任源点电子营业执照系统建设。

  湖北省工商行政管理局(以下简称“湖北工商”)及时响应国务院及国家总局的号召,实现了信用信息公示系统,电子营业执照系统等的上线。

  业务挑战:

  海量数据如何存:传统的数据存储多采用传统关系型数据库加集中存储的方式,而这种传统的架构在面临海量数据存储时,由于架构的原因,会给网络及存储产生极大地压力,最终产生数据存储方面的瓶颈;同时,传统的关系型数据库在非结构化数据的存储方面存在先天的不足;随着客户业务数据的不断增长,需要随时对数据的存储进行扩展,而传统的数据存储架构不能有效地支持节点的线性扩展,随着节点的扩充,性能会出现瓶颈。

  海量数据如何快速查询:进入大数据时代,数据类型不再局限于结构化数据,随之产生的是海量的半结构化和非结构化数据,如文本,图片,视频等;但是传统的关系型数据库在面对海量半结构化以及非结构化数据查询方面存在先天的不足,而客户在信用公示体系与营业执照体系建设过程中存在大量的半结构化与非结构化数据,如系统日志,企业年报,电子营业执照等;因此,如何实现半结构化数据与非结构化数据的高效查询成为客户在信息化建设方面的一大难题。

  高并发时如何实现快速响应:根据总局的建设方案,在信用公示系统正式上线之后,企业用户会在一个集中的时间进行企业年报的申报与查询,此时就会形成对信用公示系统的高并发访问,而传统的数据处理架构多采用高性能服务器加集中存储的架构,在面对高并发访问的情景时,可能会出现响应延迟甚至系统崩溃的可能。采用何种数据处理的架构也成为客户信息化建设的一大挑战。

  解决方案:

  在此次湖北工商信息化建设的项目中,浪潮采用了浪潮云海大数据一体机作为整体解决方案,此方案为客户提供了160核,512G内存的计算能力,提供了300T的存储能力,可满足客户未来三年间业务增长需求。

  为了解决传统数据处理架构在大数据场景下的瓶颈,浪潮云海大数据一体机整体解决方案采用了全新的share-nothing架构,share-nothing架构克服了传统架构在线性扩展方面的瓶颈问题。解决方案的架构图如下:

浪潮云海大数据一体机助力湖北省工商行政管理局信息化建设 物联网世界网

  由图可以看到,浪潮的大数据平台架设在企业的日志、年报以及资格数据和电子执照等数据采集之上,再由浪潮专门的ETL工具高效处理后进入到浪潮的大数据平台里,经过先进的海量分布式技术处理后,提供给企业的各上层应用系统。

  在结构化,半结构化和非结构化数据多种数据类型并存的场景下,浪潮云海大数据一体机整体解决方案为客户提供了分布式的文件系统和分布式的数据库来作为解决方案的主题。在数据存储时,由于采用的是share-nothing架构,多节点可以同时进行数据的存储,具有极高的数据吞吐量,数据存储速度得到大大提升。浪潮云海大数据一体机采用的分布式数据库为列存非关系型数据库,可大大提高复杂数据类型查询的效率。

  在数据安全方面,浪潮云海大数据一体机在数据存储时采用了3副本的冗余存储机制,将数据进行3备份,分别存储在3个不同的数据节点上,当某一个节点出现意外宕机时,其他2个节点的数据还可使用。3副本的冗余存储机制不仅保障了数据的安全性,同时3个副本均为活性副本,可同时进行访问。

  客户收益:

  在湖北工商进行信息化建设的过程中,由于业务系统所产生的数据类型复杂,同时也要能够满足高并发响应的场景需求,传统的数据处理架构已不能满足湖北工商对业务应用的需求。

  在经过多方调研之后,湖北工商最终采用了浪潮云海大数据一体机的整体解决方案来作为其信用公示系统信息化建设的主体。

  浪潮云海大数据一体机整体解决方案采用了share-nothing架构,随着节点数的增加,浪潮云海大数据一体机的整体性能呈线性增加,为客户后期的线性扩展提供了最有利的保障。

  浪潮云海大数据一体机整体解决方案为客户提供的分布式数据库,采用key/value键值对的形式进行查询,在企业用户按照名称和注册号进行模糊或精确查询进行信息查询时,可实现真正的秒级查询。

  浪潮云海大数据一体机整体解决方案采用的share-nothing架构,以及数据3副本的存储冗余机制,在高并发的场景下,可实现多节点同时工作,多数据副本同时访问,有效的解决了传统架构在高并发场景下响应缓慢的问题。