您好,欢迎来到友迪情感。
搜索
您的当前位置:首页大数据整体解决方案范例

大数据整体解决方案范例

来源:友迪情感

大数据整体解决方案范文1

EMC Isilon:横向扩展 性能突出

大存储不是一类单独的产品,它有很多实现方式。EMC ;具有全局命名空间,所有应用可以看到统一的文件系统视图;支持标准接口,应用无需修改可直接运行,并提供API接口进行面向对象的管理;读写性能优异,聚合带宽高达数GB乃至数十GB;易于管理维护,无需中断业务即可轻松实现动态扩展;基于开放架构,可以运行于任何开放架构的硬件之上;具有多级数据冗余,支持硬件与软件冗余保护,数据具有高可靠性;采用多级存储备份,可灵活支持SSD、SAS、SATA和磁带库的统一管理。

通过与中国用户的接触,杨兰江认为,当前中国用户最迫切需要了解的是大数据存储有哪些分类,而在大数据应用方面面临的最大障碍就是如何在众多平台中找到适合自己的解决方案。

;对于虚拟化以及具有很多小文件的应用,EMC将首推以VNX、XtremIO为核心的大数据存储解决方案;对于大数据分析一类的应用需求,EMC会综合考虑客户的具体需求,推荐Pivotal、Isilon等一体化的解决方案。在此,具体介绍一下EMC用于大数据的横向扩展NAS解决方案——EMC Isilon,其设计目标是简化对大数据存储基础架构的管理,为大数据提供灵活的可扩展平台,进一步提高大数据存储的效率,降低成本。

EMC Isilon存储解决方案主要包括三部分:EMC Isilon平台节点和加速器,可从单个文件系统进行大数据存储,从而服务于 I/O 密集型应用程序、存储和近线归档;EMC Isilon基础架构软件是一个强大的工具,可帮助用户在大数据环境中保护数据、控制成本并优化存储资源和系统性能;EMC Isilon OneFS操作系统可在集群中跨节点智能地整合文件系统、卷管理器和数据保护功能。

杨兰江表示,企业用户选择EMC 。第一,简化管理,增强易用性。与传统NAS相比,无论未来存储容量、性能增加到何种程度,EMC Isilon的安装、管理和扩展都会保持其简单性。第二,强大的可扩展性。EMC Isilon可以满足非结构化数据的存储和分析需求,单个文件系统和卷中每个集群的容量为18TB~15PB。第三,更高的处理效率,更低的成本。EMC Isilon在单个共享存储池中的利用率超过80%,而EMC Isilon SmartPools软件可进一步优化资源,提供自动存储分层,保证存储的高性能、经济性。第四,灵活的互操作性。EMC Isilon支持众多行业标准,简化工作流。它还提供了API可以向客户和ISV提供OneFS控制接口,提供Isilon集群的自动化、协调和资源调配能力。

EMC Isilon大数据存储解决方案已经在医疗、制造、高校和科研机构中有了许多成功应用。

方案点评

EMC Isilon是一个强大但简单的横向扩展NAS方案,适用于希望投资数据管理而不是单纯存储的企业。当初,EMC将收购来的分布式数据仓库软件厂商Greenplum的软件与Isilon存储组合成了EMC最早的大数据解决方案。用户既可以分开选择Greenplum软件或Isilon存储,也可以选择由Greenplum软件和Isilon存储组成的一体机解决方案。现在,Greenplum软件虽然已归Pivotal公司,但EMC是Pivotal的经销商与合作伙伴,Greenplum与Isilon存储的组合方案并不会因此受到影响。

HDS UCP:统一平台 应用优化

HDS中国区解决方案与专业服务事业部总监陈戈认为,大数据存储应该是一个解决方案:“大数据解决方案是由基础架构的各部件组成的,包含数据存储、计算和分析,而存储是此架构中的一部分。”

大数据的存储类型与传统的存储类型有一定区别:在大数据存储中,更多的应用是一次写、多次读,读得更多是大数据存储的一个特点,而在传统的数据存储中,读写是随机的,由于每个应用不同,其读写的比例也是随机的;大数据存储需要具有横向的可扩展性,并可支持多种接口、多种数据访问协议,便于不同数据进入这个大数据平台。

谈到中国用户在大数据存储应用中最迫切的需求是什么,陈戈认为,中国用户最迫切的需求是如何逐步实现大数据应用,即用户从现有的模式如何过渡到大数据,如何更好地利用大数据进行经营分析。

大数据的经典定义可以归纳为四个“V”,但企业不可能一步到位实现四个“V”,这需要一个循序渐进的过程。海量的、多种类型的数据是一次性全部载入到大数据中,还是通过现有的平台进行数据初选,再导入到大数据平台中,是两种不同的实现途径。“先通过现有平台进行数据初选,再导入到大数据平台,这种方式更适合于客户逐渐实现大数据,可以缩短用户实现大数据应用的时间。”陈戈表示,“大数据主要是非结构化数据。用户可以使用基于对象数据存储的HCP,利用其独特的元数据采集和智能工具,对非结构化文件数据进行管理,实现智能的自动化,这有助于对数据进行深度分析,帮助客户从单一系统中存储、共享、同步、保护、保存、分析和检索文件数据,减少垃圾数据,进而为大数据分析建立一个良好的基础。”

谈到用户在大数据应用中遇到的主要障碍,陈戈表示,一方面,应用软件本身的智能程度是否能满足行业应用需求,应用软件是否已经成型,大数据人才是否具备等,是让大数据应用落地的关键;另一方面,如何抽取数据,放在大数据平台中进行相应的计算是另一个关键问题。

HDS可为所有数据提供单一、可扩展的虚拟化集成平台。HDS推出了“三步”云战略,从基础架构、内容和信息三个层面帮助客户解决目前所遇到的问题。具体来看,通过“基础架构云”,HDS可以帮助客户进行虚拟化和集成管理,实现数据中心的整合;在第二层的“内容云”当中,HDS可以按需提供内容,更可以不受应用地进行数据搜索和集成;在第三层的“信息云”中,针对所有数据类型,HDS在其存储平台中融入了分析功能,使客户可以从数据信息中获取洞察力。

HDS提供的UCP for SAP HANA集成了基于大量数据集的创新和内存分析技术,并提供实时的洞察力,从而使当前的信息驱动型企业可以加快其商业决策的速度。陈戈介绍说,UCP for SAP HANA解决方案结合了HDS刀片服务器技术、企业级存储系统和业内领先的网络组件,在这样一个集成的、高性能的硬件平台上可以快速交付SAP下一代内存计算技术。全球已有超过200家客户在使用HDS和SAP的大数据解决方案。

方案点评

其实,HDS的“三步”云战略也可以看成是其大数据战略。HDS借助以UCP为核心的大数据平台,可以帮助企业用户构建从基础架构到内容归档和搜索,直至信息提取和分析的全面、高效的大数据解决方案。HDS的“信息云”直接与大数据相关。UCP是一个集成了计算、存储与网络的一体化平台,它既可以提供像一体机一样的整合性、简单性,又可以提供灵活的选择,连接第三方的设备组件。HDS还通过与包括SAP在内的众多大数据分析类的合作伙伴合作,针对行业定制优质的大数据解决方案。

HP StoreAll :快速部署 极速搜索

中国惠普有限公司企业集团存储产品部存储架构师张楠向记者表示,大数据存储是一套解决方案,应该能够对大数据的Volume、Velocity、Variety和Value四个方面提供全面的支持。

第一,大数据存储要支持海量级的数据存储,比如具有PB级的存储能力。第二,大数据存储要支持更高的存储速度,支持10Gb甚至更高的网络连接。。第四,大数据最重要的是价值的体现,而为了实现这一点,存储本身应该具备快速、智能的数据检索能力。“在存储的最底层提供最直接、快捷的数据检索。这一过程简单说就是,将上层的数据挖掘工作下移,充分利用存储强大的处理能力和数据识别能力。”张楠举例说,“比如,在秒级的单位内对数据进行极速的搜索, 从几千万甚至上亿个文件中找到目标数据。”

另外,模糊查询能力也是大数据存储不可缺少的功能。智能的模糊查询将为大数据平台提供更加便捷的存储服务能力,使得存储更像一台智能的高速计算设备。

目前,很多中国用户在存储厂商的引导下,片面追求存储的大容量和高性能,而忽略了大数据存储本身应该提供的其他额外属性。;第二,无法充分利用大数据存储的价值,也很难将其运用到实际的业务中。张楠表示,究其原因,主要在于有些大数据存储产品没有开放的接口协议,或没有针对用户的大数据场景进行特别优化,也没有用户容易接受的易用的管理方式等。

惠普在大数据方面可以提供软硬结合的解决方案。惠普在收购Autonomy公司之后,将其软件与惠普的硬件平台进行了整合, 形成了一套完整的大数据解决方案。张楠介绍说,在存储方面,惠普拥有像StoreAll这样的大数据存储平台。借助HP StoreAll硬件平台,用户除了可以实现海量数据的存储和高速数据访问以外,还能实现高级的数据检索功能,对特殊文件进行快速定位。同时,结合HP Autonomy软件的特性,惠普还引入了模糊查询、智能语义库等概念,可以帮助企业用户通过存储底层为上层业务带来所需的大数据业务价值。

如今,闪存不仅在大数据领域,而且在Tier 1存储市场同样占据着十分重要的地位。对于大数据平台来说,闪存可用来提升存储的存取速度,降低I/O的响应时间等。针对那些I/O压力十分明确的大数据平台, SSD可以发挥其效果, 提升存储的性能。但是,SSD并不是万能的。因为大部分的数据都是非结构化的,而非结构化数据对I/O的响应要求远远没有对带宽的需求大,所以,让用户花数倍的价格购买SSD存储在目前来看还是比较困难的。从目前情况看,引入闪存的大数据还不是很普遍。

方案点评

惠普在大数据方面收购了两个软件公司Vertica与Autonomy,然后将它们的软件与原有的硬件平台进行整合,针对结构化和非结构化的数据都可以提供针对性的解决方案。惠普在将大数据软件与存储硬件结合上也进行了尝试,其中一个成功的例子就是HP StoreAll大数据存储平台。HP ;集成HP Autonomy搜索引擎,可以快速搜索,实现实时大数据的价值;内置对OpenStack的支持,可快速部署;支持文件和对象类型的数据存储。

NetApp:统一架构 无限扩展

如今,企业若想获得成功,就必须想方设法应对具有前所未有的复杂性、高性能的海量数据,并尽可能地管理这些数据,从中发掘更大的商业价值。

对于国内用户来说,无论企业的规模和数据量大小如何,运用大数据的关键在于,企业是否把大数据作为一个真正的工具,去体现企业的差异化,从而提升竞争力。随着越来越智慧的企业信息化的发展,IT不再是束缚企业发展的瓶颈,而是真正地融入了企业自身的业务中。越来越多的公司将大数据成功地运用于企业的商业模式。例如,在欧美,很多企业已经着手将大量资源投放在大数据领域。反观国内,在金融领域,有为数不少的企业通过大数据的分析工具来分析金融的走势,实现风险管理,进行信用卡的追踪等。此外,像零售、制造、电信等行业也已在尝试利用大数据分析工具为企业营销和决策提供支撑。

无论企业现在是否正在使用大数据工具,企业都应全面地考虑自身未来发展的需求,选择一个厂家的平台与之共同发展,这可以有效避免因数据和应用迁移带来的麻烦。

在大数据方面,NetApp能够帮助企业实现数据管理,应对业务挑战的极限,将以数据为导向的洞察转化为有效行动。。NetApp可以帮助企业用户持续管理数据,迅速把握意料之外的新商机,永久保存所有数据,并在灵活、开放的存储平台之上打造属于企业自己的大数据解决方案。

NetApp提供了可高效处理、分析、管理和访问大规模数据的大数据解决方案。NetApp的解决方案组合可划分为分析、带宽和内容三个主要用例,这被称之为大数据的“ABC”基本要素。

具体来看,分析(Analysis)是指针对极大数据集的高效分析。NetApp分析解决方案就是帮助用户深入了解和利用数字世界,将数据转化为高质量的信息,以及提供关于业务的更深入见解,从而帮助企业做出更好的决策。

带宽(Bandwidth)是指适用于数据密集型工作负载的性能。此类解决方案着重于为速度非常快的工作负载提供更高的性能。。

内容(Content)是指无限的安全数据存储。此类解决方案着重于满足可扩展的安全数据存储需求。内容解决方案必须支持存储的无限扩展能力,以便企业可以根据需要存储任意多的数据,并能在需要时找到所需的数据。

NetApp致力于通过一系列解决方案来提供高性能的运算和大数据的应用。2013年11月,NetApp再次更新了E系列家族产品,推出E2700和E5500。该系列产品采用可轻松扩展的设计,适用于要求99.999%的可靠性且稳定、高性能的工作负载。

;架构必须是针对工作负载进行优化的,具有实时处理能力;具有整合的数据保护功能;保证7×24小时运行不中断,可在线进行容量扩展,实施数据迁移等;可以实现服务的自动化。

方案点评

NetApp的技术优势集中体现在其统一存储平台上,从入门级产品到企业级产品,全部基于同一个体系架构和操作系统,不仅部署和使用方便,而且升级和扩展非常简单。当初,NetApp收购LSI Engenio,其中一个重要的原因就是为了大数据。2013年,NetApp不断更新E系列产品线,推出E2700和E5500等。E5500可以支持高IOPS混合工作负载和数据库、高性能文件系统和带宽密集型流等应用,可确保数据的高可用性、完整性和安全性。

曙光XData:高度集成 贴近行业

关于大数据存储,目前业界没有一个通用的定义。曙光信息产业股份有限公司总裁助理兼存储产品线产品总监惠润海从曙光大数据平台和解决方案角度,概括出大数据存储的主要特征。

首先,大数据存储必须支持全类型数据, 包括结构化、半结构化和非结构数据,实现统一数据支持。

其次,存储性能上,一方面,大数据存储要支持海量数据,并且要在保证数据可靠性的基础之上,实现容量与性能的线性扩展;另一方面,为了实现大数据的价值,批处理和实时处理两种措施都需要高性能的数据访问获取能力。

最后,在系统达到一定规模之后,系统的易用性和可管理性也是不可或缺的。

从应用角度来说,目前中国用户在大数据存储应用中最迫切的需求,是如何真正实现用户数据的价值,如何驱动业务发展,实现决策和运营。“从系统构建层面说,要实现数据高性价比的存储和管理,同时满足数据服务的相关需求。”惠润海表示。

针对用户对大数据存储的需求, 曙光推出了像大数据一体机这样的全类型数据分析型产品,同时还基于该产品构建了基于行业的解决方案,以帮助用户实现大数据落地。

“除此之外, 我们还提供了大数据统一数据中心解决方案, 涵盖了像主攻事物处理的DS900、DS800,以及针对文件存储的Parastor等存储产品。我们基于这些存储产品构建了大数据运营管理平台。”惠润海介绍说,“曙光的优势不仅在于可以提供全面的产品支撑,更重要的是能够提供数据生命周期过程服务支持。目前,我们提供的免费维保期限为5年。”

曙光开发了针对不同行业和应用场景的大数据存储解决方案。以金融行业为例,目前国内四大行的应用系统每年产生的非结构化数据量已达到PB级,结构化数据也以百TB计。面对如此大量的数据,如何存储、管理、利用和盘活它们呢?惠润海认为,只有通过商业智能和高级分析应用解决方案才能将数据的价值最大程度地发挥出来。

针对金融行业用户的需求,曙光开发的XData大数据解决方案利用优化的大数据处理技术,对文件管理、历史数据查询和数据分析类应用等进行深入研究,为数据爆炸式增长带来的海量数据存储及分析应用提供高可靠的解决方案。

曙光金融行业XData大数据解决方案采用曙光自主研发的SN-MPP并行数据库,同时结合大数据处理事实标准Hadoop,并充分考虑了多方面的数据收集,加入ETL工具和连接驱动器,提供了类SQL的接口,还和现有金融业务系统进行对接。

针对金融行业历史数据,XData大数据解决方案在方案设计上主要考虑了数据的安全性、历史数据高效导入、快速访问与分析报表。曙光金融行业大数据解决方案立足于基础平台建设,同时切实贴合金融行业用户需求,提供了优质的软硬一体化解决方案,为用户一揽子解决了部署、业务移植开发等技术难题,帮助用户跨过应用门槛。

大数据整体解决方案范文2

“我特别担心有客户对我说,请富士通来帮我做一个大数据解决方案,帮我解决包括研发、生产和销售在内的所有问题。说实在的,富士通真的做不到。大数据解决方案的形成是一个过程,是IT厂商与用户一道在分析企业自身运营状态与所在行业发展趋势过程中不断改进的过程。”富士通(中国)信息系统有限公司副总裁兼市场战略总部解决方案服务战略事业部总经理黄邦瑜7月11日在贵阳大数据国际年会上接受采访时表示。

数据决策的5个阶段

黄邦瑜在接受采访时强调,大数据应该是一个帮助企业决策的工具,企业管理者千万不要认为IT能代替他们做出决策。他介绍说,富士通把企业的决策分为五个阶段:

第一个阶段,以传统的根据企业管理层的经验来做决策为特征。这其中涉及一些数据,这些数据可能是管理者的纸面记录和报告,或者新闻媒体的一些信息。管理者认为该怎么做,于是拍脑袋就做出决策了。

第二阶段,以办公软件中的Excel等表格中的数据为依据进行决策。这种表格可能很大,横向纵向都有好几页。

第三阶段,为了把企业管理层从各种各样的电子表格和电子表格中庞杂的数据中出来,IT部门会用IT手段把重要的信息及时提炼出来,并且每天早上发给管理层供其决策使用。。经过提炼后,这些数据会以图形化的方式呈现。还有一些来自网络、媒体等的外部数据。所以,管理者会看到结构化与非结构化两种数据。

第四阶段,借助IT手段从大量的数据中找出规律并提醒管理层,而不是要管理者针对各种数据做出快速反应。

第五阶段,根据内外部各种数据对未来的一些业务场景进行模拟,以评估决策的效果。

“因为管理层的时间和精力有限,这就要求IT能够采集企业运营过程中产生并积累的大量准确的数据,并且从外部海量数据中摄取相应的辅助数据,然后通过数据挖掘和分析等方式,将其规律找出来,并且比较精炼地展现在决策者面前,使其能够在短时间内做出精准的判断和决策。”黄邦瑜说,“当然,前提是企业的信息化基础要足够好。如果企业没有存储运营过程中产生的大量的有价值数据,一切也都无从谈起。”

大数据对决策的辅助支持不仅适用于管理层。企业会遇到战略、市场或技术等各种不同层面、不同范围的决策问题。黄邦瑜举例说,富士通众多业务中包括医药领域的基因与新药研究。以往的新药开发主要凭借科研人员的智力和经验。如今,研究人员如果有了一个灵感或者设想,可以在高性能计算机上进行模拟和验证。大数据已经了传统的新药开发模式。

企业必须参与其中

科学与技术之间一个基本的区别在于,科学是去发现自然界中原本就存在的规律,而技术则是为了发明自然界中原本不存在的东西。就目的而言,大数据更像科学,它要做的是去发现原本存在于海量数据中的关联性规律,只不过先前IT的存储与计算能力难以胜任。

“企业在上马大数据之前首先要练好内功。以制造业为例,企业要从研发、生产、营销等流程上进行审视,看这些流程中的数据是封闭在各自的流程中,还是可以被其他流程共享,因为在从产品研发到销售的整个业务流程中,某个流程上产生的数据可能会对其他流程产生影响。上大数据应用的前提是打破企业的信息孤岛。”黄邦瑜说。

在之前的企业信息化建设中,IT供应商与用户的职责很清晰。系统集成商要根据用户的应用需求,结合企业所在行业的属性,制定并实施相应的解决方案;系统建成后,交由用户使用。而大数据应用则要求打破甲方、乙方泾渭分明的界限,要求用户与系统集成商一道完成大数据解决方案。

“现在大数据非常火,以至有的企业认为大数据就是一副灵药,马上能够解决企业存在的所有问题。实际上这是一种认识误区。”

黄邦瑜说,制造企业拥有大量的各种类型的数据,不可能找到一种解决方案把企业经营者想找的规律一下子都找出来。富士通会根据用户的需要找一个主题,用户从业务分析着眼,让数据与业务关联;而富士通则从IT入手,分析如何从海量数据中找出与该主题相关的规律,然后制定并实施相应的解决方案。

“当前,大数据尚处于起步阶段,中外企业最大的差别在于,国外企业信息化应用更成熟一些,他们会针对大数据提出自己的问题和需求。”黄邦瑜说。

云计算,特别是SaaS应用的普及,使得企业的数据越来越多地向云迁移,企业的数据安全问题因此凸显出来。黄邦瑜因此特别强调云计算下大数据应用的安全问题:“现在,企业的云应用还处于初步阶段,如办公系统、人力资源等,一旦企业的ERP等核心应用迁移到云上,而相关的法律、法规和行业监管没有及时跟上的话,企业的核心数据就有可能被他人恶意盗用,或者被服务供应商为了商业目的而滥用。”

“欧美日在这方面的监管非常严格,市场准入门槛非常高,需要企业具备多种资质。如果不能在机制上有效地保护用户数据不被滥用,那么企业会因为出于对数据安全的担心而对云计算乃至大数据应用裹足不前。”

贵在理解用户的业务

传统上,日本IT厂商比较低调,不像美国IT企业那样通过强势的市场营销开辟新的市场,并借助合作伙伴的力量迅速进行市场扩张。日本的IT厂商通常会与客户保持长期而密切的合作关系。比如说,富士通现在提倡的精益IT理念就源自几十年来与丰田汽车在生产管理方面的合作。

“传统日资IT企业与德国企业比较接近,都比较务实,注重产品品质和细节。而且日资企业的员工流动率没有美国企业那么高,技术队伍的稳定使得日资IT企业对其客户所在行业的知识和经验积累得更多。这些因素使得日资IT企业与他们的客户保持密切的长期合作关系。”黄邦瑜说,“今天看来,在与客户长期合作中形成的对用户业务深刻的理解,以及由此形成的良好的用户体验非常重要,因为大数据的实施既要尽可能理解用户的业务,又要与用户一道持续不断地对解决方案进行改进。”

黄邦瑜说:“富士通既是IT企业,也是制造行业企业,因此我们会基于自己的最佳实践,为不同的客户提供更细致的产品和服务。从产品上看,富士通的特点是比较全,包括后台的服务器、存储、网络、中间件,以及客户端的智能手机、平板电脑、笔记本电脑等。因此,富士通的整体解决方案会更加优化。

“从系统整体上规划、设计和实施大数据解决方案是富士通的优势所在。比如说,在医疗影像领域,有的美国影像设备供应商会在卖设备时附送该设备的处理软件,但它并不能满足医院除了医疗影像设备之外的其他需求。。”

大数据整体解决方案范文3

归档到磁盘

传统上,人们习惯用磁盘做备份,用磁带做归档。随着数据量的不断增加,人们需要更快速地处理、归档数据,而且要保证归档数据随时可查。虽然从成本的角度考虑,磁带仍然是最经济的归档介质,而且磁带可以实现离线的数据保护,这有利于数据的异地保存和安全性,但是性能始终是磁带最大的掣肘。Janae Lee举例说:“在美国,我们的一个客户为了提高系统的整体处理性能,在一级存储中使用了固态硬盘(SSD),之后不经过任何中间环节,就将数据直接归档到磁盘系统中。”一些互联网企业和游戏客户可能会对这种高性能磁盘归档方案感兴趣。

从技术的角度看,将磁盘用于归档是否可行呢?当磁盘上的数据越聚越多时,即使有RAID等技术作为保护,磁盘还是会容易出现故障。退一步说,就算RAID技术能够起到保护作用,RAID进行数据重构时,也要花费一定时间,当数据达到PB量级时,这种重构所花费的时间可能是用户难以忍受的。由此可见,将磁盘用于备份,一个前提是必须提升磁盘的效率、安全性,同时降低其整体拥有成本。为此,昆腾将一种原先用于通信领域的技术引入到磁盘归档方案中,推出了基于Wide Area Storage(WAS)技术的磁盘备份方案。与RAID磁盘相比,WAS的安全性大大提高,效率提高50%~70%,整体拥有成本降低50%~70%。Janae Lee介绍说:“我们的磁盘归档方案基于NAS界面,可与StorNext软件配合使用,非常适合云归档应用。磁盘归档方案将于2013年初面世。”

磁带是数据保护的最后一道防线。Janae Lee表示:“磁盘归档方案与磁带归档方案之间不是替代的关系,而是互补的关系。磁带归档市场仍在不断扩大。对于那些办公场所位置分散,又希望快速存取数据的用户来说,WAS是比较理想的选择。”

磁带不受影响

在大数据时代,磁带的重要性会进一步被削弱吗?昆腾公司大中华区总经理张金华介绍说:“从2011年昆腾在中国的销售业绩看,以DXi系列产品为代表的磁盘业务始终保持高速增长的态势,每个季度的增长率都能达到两位数,而磁带业务则与2010年持平。”虽然昆腾的业务重点已经转向数据保护整体解决方案和大数据,磁带不再是业务核心,但是昆腾并没有放弃磁带业务,对于磁带的研发投入也没有减少。

“我们为磁带库产品增加了一些新的功能,比如EDLM自动磁带内容检查功能、双机械臂、Active Vault等。这些新功能的加入,可以让磁带库与StorNext软件更好地配合使用。”Janae Lee举例说,“在广电领域,10%的数据存储在磁盘上,90%的数据存储在磁带上。用户还要经常调取磁带上的数据。StorNext 4.3版本增加了一项新功能,在将数据写入磁盘的同时,也会写入磁带。这种技术非常适合电视台节目上传的应用。”

软硬件都重要

在昆腾的大数据解决方案中,StorNext扮演了极其重要的角色。以前,StorNext都是以软件的方式提供给客户的。但是有客户反映,StorNext的部署和调优比较复杂。为此,从2011年开始,昆腾开始提供基于StorNext的软硬件一体化解决方案。

大数据整体解决方案范文4

人机结合,数据化运营的必然选择

目前世界上没有任何一台计算机的性能能够比拟人脑。运营小二在实践中提炼出来的经验和规则是最宝贵的知识。大数据解决方案如果忽视了人的经验,则一定会像无头苍蝇,盲目而不接地气。而机器,算法,程序则能够夜以继日的挖掘出数据中的细节,这些细节是人难以识别和发现的,有些也难于解释。但是却能够产生出人意料的价值和效果。人机结合,是让数据价值最大化的必然选择。

在爆款模型解决方案的整体构建中,运营,产品和数据科学团队进行了多次沟通,将业务痛点不断提炼总结,最终将整体解决方案的目标定位在两个点上。第一,最大可能的减少运营小二的审核工作量;第二,模型算法推荐出来的高分商品,将在实际售卖中比人选商品实现更高的成交。

针对第一点,运营提炼总结出了6条商品审核不通过的硬指标,即:

1、卖家商品质量DSR< 4.6

2、报名备货总额< 10万元

3、因选款无优势被拒绝次数> 3

4、报名价格>全网历史最低价

5、在淘宝的评价数量< 3

6、在淘宝的月销量< 3

触发这6条指标中的任意一条,商品将不会通过审核,在模型中,我们将这样的商品打为0分。在爆款模型整体解决方案构建的第一期,我们将这六条规则固化,发现每天待审的商品中有40%都因触犯了这六条高压线而打分为0。然而,BI针对此规则监控了2周时间,发现0分商品依然有很多通过了审核。0分商品的准确率在70%-80%左右,其中女装类目的准确率只有50%左右。也就是说,根据运营经验总结固化出来的规则也是有问题的。针对这一点,BI团队再次与运营和产品进行确认。而运营也修正了他们的经验。那些通过审核的0分商品中,大部分是新品,在全网的销量和评价数很少,但是却需要聚划算给与支持。针对这一点,BI又一次调整了0分规则,调整过后,0分商品数量占整个审核商品的20%左右,而准确率则高于了90%。经过多次调整和确认,固化了运营经验的0分规则满足了预期。

针对第二个目标,即模型推出爆款,数据科学团队离线试验了多种机器学习的算法,进行大数据挖掘。在数据挖掘建模的过程中,从特征的选择,数据的清理,算法库的构建,集成,到最终的离线数据试验,算法效果比较,数据科学团队进行了大量的尝试。从近百个描述商品,卖家,品牌,平台表现的指标中,进行变量选择;解决了定性变量在建模中所带来的困难;通过并行计算,提升了算法试验的效率;最终构建了包含变量选择,数据清理,以及逻辑回归,CART,加权k近邻,elastic net,随机森林,gbm,支持向量机,神经网络以及flexible local tree(FLT,法决发明)等多种算法的算法库。形成了机器学习算法方面的整体解决方案。在此基础之上,又对数据进行了反复的研究和算法试验,最终从中选出了最适合聚划算爆款模型应用场景的FLT算法。

之后,BI团队部署了该算法,并针对女装类目进行了在线的对比试验。我们对比了6月1号到6月10号报名商品中通过审核后实际上聚的成交金额,与模型打分。。而且商品的成交金额与模型打分有着高度一致的保序性。即模型打分越高的商品,实际成交金额越高。这说明了算法是有效的,确实从大数据中找出了爆款的模式和规律,而这些规律则是人难以发现的。

大数据整体解决方案范文5

紫光集团近几年在IT领域,特别是半导体领域积极布局,通过不断并购,在增强自身整体实力的同时,实践着自主可控的创新梦。在云计算、大数据时代,打造从“芯”到“云”的完整产业链是紫光集团的大战略。

。秉承“自主创新+国际合作”的发展理念,紫光西部数据致力于为各行业客户提供基于全产业链的大数据服务,成为中国大数据产业战略合伙人,这是为逐步实现紫光集团大战略而设定的一个“小目标”。紫光西部数据从现在开始起步。

构建从“芯”到“云”的大生态

众所周知,紫光集团是中国IT界的一艘新航母。在国家集成电路产业推进战略的引导下,紫光集团以“自主创新+国际合作”双轮驱动,确立了以集成电路产业为主导,向泛IT、移动互联、云计算与云服务等信息产业核心领域集中发展的战略。

从2013年以来,紫光集团通过一系列的战略并购,不断完善自己的战略布局,丰富产品线。紫光集团先后投资超过1500亿元,收购了全球移动通信芯片公司展讯通信和锐迪科,控股H3C和惠普中国企业业务,分别成立紫光展锐和新华三集团。清华系旗下最重要的IT产业平台已具雏形,全面构筑从“芯”到“云”的信息产业生态系统并非妄言。

IDC预测,到2020年,全球的数据总量将达到44ZB。数据规模的持续增加,用户对数据处理的速度,以及系统的可用性、可扩展、灵活性等的要求不断提升,这些都是大数据存储迫切需要解决的问题,也是大数据存储产业面临的新机遇。

毫无疑问,大数据存储业务是紫光集团这艘航母前进的主要动力之一,而紫光集团的战略布局也早为大数据存储业务的快速发展埋下伏笔。2016年7月,紫光集团收购武汉新芯多数股权后,长江存储科技有限责任公司正式成立。紫光集团持有长江存储科技有限公司超过50%的股份。紫光集团董事长赵伟国出任长江存储公司董事长。这是紫光集团的大战略从“芯”开始的一个具体体现。

在今年举行的第二届中国大数据产业峰会暨中国电子商务创新发展峰会上,赵伟国曾表示,从2016年开始,紫光集团计划投资300亿美元用于存储器芯片制造,这大概是中国有史以来最大的存储项目。大数据的发展需要海量存储,而中国以前在这方面是空白,这便是紫光集团选择的发力点。芯片是产生和存储数据的基本单位,也是发展大数据存储的基础。只有在芯片上掌握主动,才能在发展大数据存储时做到有的放矢。

在紫光集团着力打造的从“芯”到“云”的产业链中,“芯”是指芯片,那么“云”当然是指大数据、大互联、大安全和云计算。紫光集团控股的新华三集团在云和大数据方面提供了完整的解决方案,包括服务器、存储、网络设备,以及云操作系统、大数据安全系统等,在除运营商以外的企业网络领域,紫光排名第一,在全球仅次于思科。

在大数据存储的产业链条上,有了武汉新芯的存储芯片,又有了新华三的存储解决方案,这中间是不是还少了一个能够将它们串联和彻底打通的环节?紫光西部数据应运而生。

自主创新也少不了国际合作

紫光西部数据于2016年3月28日注册成立,总部位于南京市秦淮高新技术园区内,市场和销售总部则位于北京。紫光集团旗下紫光股份持股比例为51%,而西部数据持股比例为49%。

紫光西部数据首席执行官缪刚表示,新公司的愿景可以概括为一句话:以数据成就未来,做中国大数据产业战略合伙人。

;第二,自主创新,安全可控,通过自主研发,实现自主、安全和可控,在保护数据可靠的基础上,保障多种核心应用的安全、稳定运行;第三,行业优化,扁平融合,针对具体的行业需求,开发符合行业特性的全方位数据服务,通过实现应用层扁平化,实现大数据整体发展;第四,开放合作,携手共赢,全面打造开放创新的平台,携手各界合作伙伴,建立合作共赢的生态体系,合力推动大数据产业的创新发展。

为了实现上述宏伟目标,紫光西部数据需要在坚持自主创新的基础上,以开放的胸怀,采取积极的合作策略,而西部数据无疑是一个理想的合作伙伴。

西部数据是全球领先的数据存储解决方案提供商,在全球硬盘市场的占有率排名第一。与紫光集团类似,西部数据近几年也通过一系列的收购不断完善产品的布局。2012年,西部数据收购昱科环球存储科技咨询有限公司(HGST),目的在于为企业级市场的客户提供高价值的存储解决方案。2016年5月,西部数据又以190亿美元的大手笔完成了对闪迪(SanDisk)公司的收购,快速转型,成了闪存市场的佼佼者。

美国西部数据公司全球高级副总裁、数据中心系统事业部总经理唐戴夫表示:“我们之所以选择紫光集团作为合作对象,一方面是因为紫光集团具有本地研发、设计、生产、营销的能力,可以提供针对本土用户需求的定制化的解决方案;另一方面,紫光集团拥有宽泛的产品线和业务,紫光旗下的新华三、紫光互联等,都可以成为西部数据的合作伙伴,形成解决方案和业务上的互补。西部数据与紫光集团的全方位合作,让我们感觉未来在技术和业务的创新大有可为。”

缪刚进一步介绍说:“合资公司将在核心存储技术、企业级存储解决方案,以及大数据全产业链服务等领域形成关键战略合作,推动紫光集团从‘芯’到‘云’的信息产业生态系统的构建,同时帮助西部数据实现业务拓展,为智慧城市、金融服务、媒体娱乐、天文气象、电信、基因科学、医疗卫生、新兴互联网等各行业客户提供符合其需求的数据存储和数据服务解决方案。”

打造系统级的存储产品

紫光西部数据为何落户南京?首先,紫光西部数据在南京现有一支70多人的研发团队,未来还要进一步扩张,这也是让紫光西部数据引以为豪的实现自主可控的基本保证。其次,紫光西部数据接下来要与南京当地的、企事业单位加强合作,紫光西部数据与南京市有关部门联合成立的大数据研发中心正在酝酿之中。

正如缪刚所说,紫光西部数据要首先扎根中国,为中国用户提供满足其需求的定制化的大数据存储解决方案。紫光西部数据9月8日举行成立庆典之后将全面展开营销活动,而最先推出的产品就是西部数据特有的动态归档(Active Archive)系统。这一动态归档系统是一个自主的对象存储系统,可以方便地扩展存储容量,最高可达数PB,且具有更高的可靠性和更好的成本效益,能够同时满足传统应用需求和新型应用需求。

时至今日,西部数据已经不再是那个拥有单一硬盘产品的厂商,其产品线涵盖存储介质、存储平台、系统软件和系统构件,其中存储系统成了最主要的抓手,动态归档系统就是代表,而这正是紫光集团与西部数据合作最重要的一类产品。

“我们计划利用3~5年的时间,打造一个完整的系统级存储的产品框架。以动态归档系统为例,这是新兴的对象存储,与新华三的存储产品线并不冲突,反而是互补关系。”缪刚介绍说,“在动态归档系统的基础上,我们会与中国的ISV携手,针对不同的应用场景提供定制化的服务,打造产品与需求深度融合的本地化解决方案,同时也不排除与开源技术相结合,研发基于开放平台的动态归档系统的可能性。这正是紫光西部数据的优势和价值所在。”

大数据整体解决方案范文6

“IBM对大数据有自己独到的观点。”IBM软件集团大中华区业务分析洞察及智慧地球解决方案总经理卜晓军在主题为“大数据·大洞察·大未来”的年度大数据战略会上的发言举重若轻。的确,IBM严谨的智慧分析洞察方、完善的大数据平台解决方案以及广泛深刻的行业落地实践,让IBM有底气宣布即将驯服大数据,IBM的大数据平台或许就是企业正在苦苦寻找的“长鞭”和“缰绳”。

对付大数据4个V

。。

“这一切只是开始。”卜晓军补充道,“3V只是对大数据最基本特征的归纳,实际上,大数据向外延伸的涵义很丰富。”IBM就归纳总结了第4个V——Veracity(真实和准确),为什么第4个V足以与前3个V相提并论?“这是因为,只有真实而准确的数据才能让对数据的管控和治理真正有意义。”随着社交数据、企业内容、交易与应用数据等新数据源的兴起,传统数据源的局限性被打破,企业愈发需要有效的信息治理以确保其真实性及安全性。

如何充分应对大数据的4V特性,成为了想获取大数据深层价值者面前的一道难题。基于“3A5步”动态路线图的大数据战略再次体现了IBM完整的软件体系架构和综合能力。

“单独谈大数据没有意义,正如认为Hadoop足以解决大数据所有问题一样过于片面。”IBM软件集团大中华区信息管理软件总经理卢伟权强调,“大数据应该渗透到企业的IT架构中,这就要求大数据平台具备在信息原有的形式上进行进一步的分析、使所有的数据具有可视性并被有效用来分析、为新的分析应用开发更加有效的环境、优化与合理分配工作量、安全与治理等能力,兼容企业级的可用性、管理性、安全性和集成性。”

Hadoop缺乏数据管理的能力,IBM将Hadoop整合到大数据平台中并结合已有的产品,由此以四大核心能力Hadoop系统、流计算、数据仓库和信息整合与治理为支点提供端到端的大数据解决方案。

卢伟权总结道:“IBM将数据库领域里多年积累的经验,和对用户需求的高度考量融合到大数据平台中,通过‘增强’的理念把大数据解决方案有机整合到客户现有的数据平台上,保护客户现有的投资,在不摈弃传统数据仓库的前提下,通过信息整合和治理等工具,为客户创造效率和成本的最佳平衡。”

落脚点是行业应用

不落实到行业,不出示行业应用,人们对大数据的感知仍然会停留在“它仅仅是一个技术趋势”的肤浅层面。。

“端到端的总体技术,包括信息治理和集成、大数据管理、实时分析,最后的落脚点是行业应用。”IBM中国开发中心信息管理首席架构师及大数据架构师陈奇说明技术服务于商业是终极追求。

伴随着制造业演变为“供应链核心模式”,IBM软件集团制造事业群总经理萧丁瑞希望制造业企业在IBM的帮助下实现供应链的可见性,以快速有效的方式处理供应链环节中的数据,弱化需求与供给之间的波动传导,达到产销协同。

IBM软件集团大中华区架构师总经理林旭认为,随着竞争不断激化,实时数据处理和客户行为预测成为运营商抢占的高地。IBM有能力帮助电信公司整理分散数据,管理动态数据,实时获取用户行为分析,增强客服效率和业务推送精准度。

“在金融行业中,客户数据是最珍贵的,这就决定了大数据平台必须是对传统数据仓库的补充和增强。”IBM软件集团大中华区银行业解决方案高级顾问陈剑指出,“此外,金融行业除了对于用户行为预测和实时处理等需求之外,还面临着风险和欺诈的巨大挑战。”IBM大处理解决方案可建立风险模型,通过实时匹配交易行为模型,对风险和欺诈进行监控,并补充和增强原有传统数据仓库中客户档案和信息。

事实 说话

【黄河水利委员会】

IBM与黄河水利委员会合作,帮助其构建黄河数据交换与共享服务平台,高效适应水利系统工程复杂性的需求。通过利用IBM InfoSphere软件,黄河水利委员会得以连接各个孤立的数据中心到统一的数据交换与共享服务平台,有效消除了各业务系统和各组织结构之间的信息孤岛,简单获取黄河数据资源的单一视图,并确保了数据的完整性、及时性、准确性和一致性,同时首次实现元数据的可视化统一管理——在防汛减灾、水量调度、工程管理、办公自动化、水土保持、遥感监测、档案管理等方面显著提升业务管理水平,推进更智慧的“数字黄河”。

【越南东方商业银行】

IBM与越南东方商业银行展开合作,利用IBM Netezza数据仓库一体机、IBM Cognos业务分析软件、IBM InfoSphere Data Stage Solution以及IBM银行业数据仓库模型和相应的软件服务等。IBM Netezza数据仓库一体机为东方商业银行所有部门的业务人员直接部署分析能力,包括销售、市场营销、产品开发和人力资源,支持其处理客户、业务和财务数据,并最终实现其从综合型银行向零售型银行的转型,助力东方商业银行建立以客户为中心的商业,依此开展零售银行业务,并力争达成在2015年前成为越南十佳品牌股份制银行的目标。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- udiu.cn 版权所有

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务