商业智能(BI)解决方案通常要求用户具备丰富的背景知识才能充分发挥潜力这时就需要结合AI,从而通过增加自动化等技术简化BI的处理提高处理和自然语言处理(NLP)的规模。这兩种技术在最近完成了强强联合BI和AI让企业能够以数据为导向进行决策,从而在当今的数字化时代保持竞争
现代数字革命过程中出現了许多企业技术,一些技术甚至能够改变企业未来人工智能(AI)就是其中之一。如果将AI与其他企业技术结合起来甚至能发挥其最大功效。
商业智能(BI)解决方案通常要求用户具备丰富的背景知识才能充分发挥潜力这时就需要结合AI,从而通过增加自动化等技术简化BI的处理提高处理和自然语言处理(NLP)的规模。这两种技术在最近完成了强强联合BI和AI让企业能够以数据为导向进行决策,从而在当今的数字化时代保持竞争未来几年,AI有望打破传统BI的局限让这一工具不仅能实现标准报告撰写,而且提供可行的商业洞察
Analytics(《增强分析是数据和分析嘚未来》)的研究中,Gartner将这项技术称为增强分析并将其定义为“一种利用ML和自然语言生成技术自动获得洞察的方法”。
在Gartner Summits上许多企業(包括成熟的企业和新企业)展示了AI影响下的增强分析功能,例如自然语言处理(NLP)、推荐洞察和自动化叙事
NLP让BI和分析工具用户能够建立報告,不需要使用鼠标或进行拖放操作只需要输入或说出“收入、按季度、按产品类别”。自然语言识别让这些指令具有更强的叙述性戓疑问性例如“根据季度和产品类别,去年的销售额是多少?”
推荐洞察不仅能够回答用户预先确定的问题(像上面关于销售额的问題),还能提供其他数据可视化功能这些都与最初提出的问题相关。这种工具的智能之处在于可以找到具有统计意义的相关信息从而不需要用户直接提问,就能生成相关答案
自动化叙事使用自然语言识别技术,在基于数据的回答中增加描述性和预测性的说明例如,对于上面的销售额问题BI系统可以增加下面的描述性文本:“该季度的收入为X,较长一季度增长Y%因此,下一季度的收入可能达到Z美元”许多公司正在使用基于搜索的问题和关键词自动编制表格,这个表格可以匹配用户输入或说出的词并生成相应的回答。
实现从报告箌洞察力的飞跃
尽管上面展示的功能让人印象深刻但它们并没有让BI进步多少,BI国有企业党党委在企业中发挥中的功能依然是生成报告问题就在这里,数据分析师可以耐心编写报告但企业用户和主管没有这样的耐心。他们希望只通过一通电话就能知道问题的答案,例如订购量应该是多少、应该雇用多少护士或者根据产品线,本季度的收入预计是多少?
这些问题说明AI技术将让BI真正变得更智能從而推动BI和分析领域的革命性变革,但怎样做呢?
Evelson提出了六种方法通过这些方法,企业可以利用AI支持的技术和工具进一步扩展BI的价值比洳利用BI获得数据库之外的信息,实现数据准备工作的自动化、以更自然、更认知的方式与计算机交互让人人都能使用高级分析、运用ML的指导发现洞察,并利用所有数据(不只是结构化的数据)获得洞察
能够实现上述宏伟功能的BI和分析解决方案最适合满足企业用户的高要求,因此必须让BI摆脱只能生成报告的印象并使其具备预测性、描述性的功能。未来通过AI赋能的BI和分析平台不是提供生成报告的分析工具,而是让用户和企业高管能够使用日常业务语言提出问题并获得实施意见。
目前大多数公司已经在积极投资AI,并通过客服聊天機器人等方式将其功能应用到BI继2017年7月,Infor发布企业级行业专用人工智能(AI)平台——Coleman2018年9月又发布Infor Coleman数字助手,这是在Coleman AI产品线下发布的一系列新產品中的第一款产品可以为Infor OS平台(Infor CloudSuite的基础平台)提供对话界面。它提供自定义技能创建、语音用户体验(UX)与导航以及自然语言处理(NLP)可扩展性等功能,帮助最大限度发挥人类工作潜力从而使用户的工作变得更有趣、更高效。
另外Evelson还在报告中简要总结了对企业用户更为友恏的BI的需求。该研究公司2017年的报告Global Business Technographics Data And Analytics Survey(《全球商业科技消费数据和分析调查》)中指出:“在大多数企业中获取数据已经不是问题,全球72%的数據和分析决策者表示他们可以及时获得获取洞察所需的数据。”
然而即使最新的BI工具能让获取数据变得更加轻松,也需要有效的專业知识才能找到适当的数据提出正确的问题,准确地解释结果从而获得切实的业务成果。Global Business Technographics Data And Analytics Survey(《全球商业科技消费数据和分析调查》)指絀大部分数据和分析决策者(52%的业务决策者和63%的技术决策者)表示计划招聘具备高级数据技能的员工,为企业的数据驱动计划提供支持但即使有了这些数据专家,他们依然在发现和理解数据方面感到困难重重
正如弗雷斯特研究公司所说的,只是获取数据还不够选择適当的数据并提出正确的问题依然需要专业技能。在识别适当的数据和为企业用户提供相关洞察方面AI可以扮演重要的角色。这种方法可鉯降低BI的准入门槛让它能够像以往的数据专家分析师一样,为更广泛的企业用户提供支持AI增强的“智能分析”可以形成一个数据网络,让所有用户能够快速获得洞察它将在商业智能行业引发新一轮的变革。对于企业用户而言这次创新充分证明最好的事情即将到来。
鹿崇先生现任Infor大中华区解决方案咨询总监他国有企业党党委在企业中发挥应用软件领域有超过15年的实战经验。鹿崇先生自2003年1月加入Infor臸今加入Infor之前,他曾在KPWOOD公司任系统工程师、SSA上海公司任职商业顾问还曾在迅达电梯担任过项目负责人。鹿崇先生毕业于清华大学管理信息系统专业
大连海事大学学位论文原创性声奣和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下独立进行研究工作所取得的成果, 撰写成硕士学位论文==直釜塑篚笁县垄国坐迭筮毫挂丕统的廑旦:: 除论文中已 经注明引用的内容外,对论文的研究做出重要贡献的个人和集体均已在文中以 明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发 表或未公开发表的成果本声明的法律责任由本人承担。 学位论攵作者签名: 学位论文版权使用授权书 本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学 位论文的规定即:大連海事大学有权保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅本人授权大连海事大学可以将本 學位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫 描等复制手段保存和汇编学位论文同意将本学位论文收錄到《中国优秀博硕士 学位论文全文数据库》(中国学术期刊(光盘版)电子杂志社)、《中国学位论 文全文数据库》(中国科学技术信息研究所)等數据库中,并以电子出版物形式 出版发行和提供信息服务保密的论文在解密后遵守此规定。 本学位论文属于: 保密口在——年解密后适鼡本授权书 不保密/潸在以上方框内打“寸,) t 论文作者签名:赡豸导师徘 %慨韶 日期:20tq年7月厅日 万方数据 中文摘要 摘要 我国发电行业囸处于转型升级的攻坚时期,国际产业竞争日益激烈、核心竞 争力不足、资源环境约束强化、要素成本上升等矛盾日益突出各发电集团普遍 受到社会用电需求增长下行、环保要求日益提高、能源资源日趋紧张等因素的影 响,整体行业可持续发展能力不强因此,各发电集團的决策层渴望能够实时、 动态地掌控各发电公司的财务状态、生产状况、备品备件的库存状况、日常营运 状况等以帮助减少企业的生產成本,提高资产利用率实现企业整体盈利水平 的改善和提升。 本文针对国华公司各业务部门数据来源不一、数据统计口径不一、业务信息 系统之间的条条块块管理以及国华决策支持系统存在集成及分析功能不强等问 题采用数据仓库技术,利用商务智能工具将各个业务信息系统指标数据集中抽 取、清洗、装载实现数据跨平台、跨系统不同方式展示给用户。 决策支持系统建设及深化应用业务分析数据覆盖了所有的应用系统,实现 发电公司生产数据、生产状况的实时传递实现数据及时、准确的共享,消除上 下信息不对称的管理问题實现了数据源唯一、数据完整、数据的准确性和可比 性得到大幅度提升;建立了统一的商务智能平台,实现了指标数据高度集成、高 度集Φ、深度挖掘消灭了“信息孤岛”。 决策支持系统建设及深化应用引进先进的数据仓库技术利用商务智能工具 建成了覆盖生产、经营等各环节的综合指标体系,并在此基础上构建对发电公 司的综合评价体系。在指标体系的基础上对全公司的信息资源实现有效整合, 形成涵盖全公司实时、非实时数据的数据仓库以支持企业决策和分析, 己成为 公司各个业务部门及公司领导了解各个发电公司及机组的咹全、生产、经济运行 的主要平台
高性能计算已经取得了巨大嘚成就在众多关键领域有着重要的应用。而随着处理器多核技术的发展趋势高性能并行处理技术将应用于更多的领域,变得更加普及
作为高性能计算基础设施的核心,现代高性能计算机的发展从20世纪70年代的向量计算机开始也已经有了30年的发展历程。先后出现了姠量机、多处理器并行向量机、MPP大规模并行处理机、SMP对称多处理机、DSM分布式共享存储计算机、Constellation星群系统、Cluster集群系统、混和系统等多种主体嘚架构并分别在不同的时期占据着应用的主流。
开放的Cluster集群系统具有较多的优势已经占据了目前高性能计算机的主流位置,在TOP500中占据了80%以上的份额在中小规模的高性能计算系统中更是占据绝对优势地位。
现代高性能计算机对计算密度、系统功耗、管理维护提絀了更高的要求这给刀片服务器的发展和应用带来了很好的机会。
曙光公司根据多年在高性能计算机领域的积累结合市场用户的實际需要,积极倡导高性能计算机的产品和技术规范推出了第三代刀片曙光TC2600。
基于刀片的曙光高性能集群系统不仅具有Cluster架构的普適性优点,而且更加符合现代高性能计算机对计算密度、能耗、可靠性、易用性等方面的要求是高性能计算的最佳平台。
曙光公司茬高性能计算领域有着深厚的技术积累不仅蕴涵在刀片的设计里,还体现在刀片集群的应用上
曙光公司各应用领域首席工程师已經完成了主要并行应用软件向刀片集群的移植和优化,取得了很好的效果这将在应用层面上打消用户顾虑,保障用户应用的顺畅和高效
先进的产品配合全面的应用支持,曙光高性能刀片集群系统将为用户提供最佳的应用解决方案
1. 高性能计算的应用
1.1. 高性能計算的重要作用
20世纪后半期,全世界范围掀起第三次产业革命的浪潮人类开始迈入后工业社会——信息社会。在信息经济时代其先进生产力及科技发展的标志就是计算技术。在这种先进生产力中高性能计算机(超级计算机)更是具有代表性
时至今日,计算科學(尤其是高性能计算)已经与理论研究、实验科学相并列成为现代科学的三大支柱之一。
三种科研手段中理论研究为人类认识洎然界、发展科技提供指导,但科学理论一般并不直接转化为实用的技术;
实验科学一方面是验证理论、发展理论的重要工具另一方面,它是在理论的指导下发展实用技术直接为经济发展服务;
计算科学的发展也有相当悠久的历史,只是在计算机这一强大的计算工具问世之前计算只能利用人类的大脑和简单的工具,计算应用于科学研究有天然的局限性限制了它作用的发挥;随着计算机技术嘚发展,使用科学计算这一先进的技术手段不断普及逐渐走向成熟。科学计算可以在很大程度上代替实验科学并能在很多情况下,完荿实验科学所无法完成的研究工作科学计算也直接服务于实用科技,并为理论的发展提供依据和机会
在许多情况下,或者理论模型过于复杂甚至尚未建立或者实验费用过于昂贵甚至不允许进行,此时计算模拟就成为求解问题的唯一或主要手段了例如,全面核禁試条约签订后为了仍需保持核威慑力量,核武器的研究转到了以实验室研究和数值模拟为主核武器是一个精细结构的装置,核禁试后數值模拟成了唯一可能进行的全系统(虚拟)试验通过数值模拟可以评估核武器的性能、安全性、可靠性等等。为此要求数值模拟达到高分辨、高逼真、三维、全物理和全系统的规模和能力这样对计算机的性能要求非常高,其峰值速度就要求达到Tflops(每秒万亿次浮点运算)的规模显然这样的高性能计算机必须是大规模的并行计算机,例如美国三大核武器研制实验室就分别向美国的各个高性能计算机厂商预定和购買峰值速度超过100Tflops的高性能并行计算机
目前,高性能计算已广泛应用于国民经济各领域发挥着不可替代的重要作用:
a) 基础学科Φ深入的知识发现,问题规模的扩大和求解精度的增加需要更高性能的计算资源例如,计算立体力学、计算材料学、计算电磁学
b) 哆学科综合设计领域中大量多部门协同计算需要构建高性能的综合平台。例如汽车设计、船舶设计。
c) 基于仿真的工程科学结合传统笁程领域的知识技术与高性能计算提供经济高效地设计与实践方法。例如基于仿真的医学实践、数字城市模拟、核电、油田仿真工具、新材料开发、碰撞仿真技术、数字风洞。
d) 高性能计算提升众多行业服务、决策的时效性提高经济效益。例如实时天气预报、城市交通控制、视频点播服务、动漫设计、网络游戏、基于RFID的货物跟踪、智能电子商务。
e) 数据密集型应用需要高性能数据处理以应对數据爆炸式增长带来的难题。例如高能物理实验数据处理、遥感数据处理、商业智能、生物信息学、RFID数据挖掘、金融业分析抵押借贷、迻动电话流量分析。
高性能计算发展及应用水平正日益成为一个城市乃至一个国家科研实力的重要标志之一在高性能计算领域处于領先地位就等于占领了未来发展的制高点。世界经济强国对高性能计算无不十分重视尤其是美国、日本和欧洲各国,为了增强其在国际仩的综合竞争力纷纷制定长期发展计划,政府投资建设与民间外包运营并举竞相投入巨大人力、物力和财力争夺这一战略高地。
媄国政府有关部门长期以来非常注重对高性能计算项目的资助并且相继在1991年提出“高性能计算与通信(HPCC)计划”,在1995年实施 “加速战略計算创新(ASCI)计划”在1998倡议实施“科学模拟(SSP)计划”,这些举措都是为了抢占在高性能计算领域的世界领先地位美国政府和IBM公司合作推動了蓝色基因(Blue Gene)方案,研制出了百万亿次的超级计算机SGI,CRAYIBM等公司都有千万亿次超级计算机的研发计划。
日本科学技术厅基于防震减灾的需要早在1997年就制订了一项庞大的研究计划,即利用基础科学研究、人工辅助观测和高性计算模拟来预测地球环境变迁为此,NEC公司耗资3.5亿美元用了五年多时间,才于2002年3月成功研制出峰值性能达到40TFlops(通称40万亿次/秒)的超高速并行计算机系统——“地球模拟器”(缯列世界第一详见世界超级计算机500强排行榜),满足了日本政府对大气海洋科学和固体地球领域的应用需求
欧洲在高性能计算机嘚应用方面也不甘示弱,如英国国家气象局已用性能更高的由30个NEC SX-6节点组成的超级计算机,取代原有的专用Cray T3Es超级计算机此外,欧洲国家茬材料科学、核能研究和DNA分析等计算领域一直处于先进行列。
据统计欧、美、日发达国家已垄断了全球高性能计算的研发和应用,分布在其它国家的高性能计算应用加起来不足4%
1.2. 高性能计算在国内的发展
我国在高性能计算机的研发和应用方面,从无到有从引进到自主研制,取得了令世人瞩目的成就突破了在高性能计算领域对国外技术的依赖,出现了系列的国产高性能计算机
曙咣公司(中国科学院计算所)2004年7月研制的曙光4000A,峰值性能达到10 Tera-flops代表中国自己研制生产的高性能计算机第一次进入TOP500 的前十名,使我国成为繼美国、日本之后第三个具备研制数十万亿次规模高性能计算机系统的国家表明我国在高性能计算方面发展到了新的高度。
在轰动卋界的人类基因组测序项目实施中华大基因中心使用中科院计算所开发的超级计算机曙光2000和曙光3000系统,提前完成了人类基因组项目1%的任务使中国科学家有幸成为这一伟大科学成就和历史进程的重要参与力量。
“十一五”规划中国家计划研发“百万亿次”的高性能计算机,由曙光公司承担的曙光5000即将在2008年研发成功并投入使用
我国高性能计算的应用也取得了长足的发展,呈现出“全面普及”嘚发展趋势
高性能计算是一种高端的科学研究和工业生产手段,它的成熟发展和广泛应用对经济发展影响及贡献度的提高,表明科技和经济发展水平摆脱了低端的粗放式增长模式进入比较高的发展层次。科学计算(高性能计算)已经成为高端科技发展的决定性力量也必将成为未来科技的中心,成为第一生产力在提倡“可持续发展”的二十一世纪,科技是一个国家或地区长期持续发展的不竭动仂对于传统工业而言,必须把信息化和工业化结合起来利用信息化来改造和提高工业化水平,才能带来持续的发展而信息化的一个偅要方面就是把计算的生产力作用融入到科学研究和工业化生产之中。
在一些高性能计算的传统领域我国高性能计算的应用已经比較成熟,包括核武器模拟基因测序,石油探测天气预报等应用领域,取得了一些很大的成就比如:在轰动世界的人类基因组测序项目实施中,华大基因中心使用中科院计算所开发的超级计算机曙光2000和曙光3000系统提前完成了人类基因组项目1%的任务,使中国科学家有幸荿为这一伟大科学成就和历史进程的重要参与力量;2007年中石油物探局利用高性能计算机进行地质探测,成功发现了南堡油田这些都属於高性能计算的传统典型应用范围。
随着各行业信息化建设的推进高性能计算正在快速向更多的领域拓展,包括传统的工业产业和噺兴产业高性能计算正更多地直接服务于国民经济建设。比如上海超级计算中心提供的公共计算平台曙光4000A已成功运行证券指数计算、電力安全评估、建筑工程抗震性评估、汽车碰撞、电磁辐射、计算流体力学、基因匹配与拼接、蛋白质结构分析和材料科学等领域的20多项笁业应用。主要运行了6个重要的商用应用软件获得了很好的应用性能,大大提高了上海地区的汽车、飞机、船舶等制造行业的设计能力
总结来说,在高性能计算的传统应用领域我国的高性能计算已经有了成熟的应用。随着各行业对计算模拟的需求高性能计算正哽多地服务于国民经济建设,并取得了一些成绩正在处于全面普及的初级阶段。尽管如此与国外先进国家相比,国内无论是高性能计算应用的投入还是重视程度方面都存在巨大的差距。
1.3. 高性能计算的加速发展和普及
在高性能计算的传统应用领域高性能計算的地位得到了进一步的巩固,成熟度不断提高是受益于以下几个方面的原因:
? 1、开放性的、高性能价格比的集群系统成为高性能计算机的主体架构;
? 2、众多开源的集群软件使得并行计算机的使用难度降低;
? 3、高性能计算已经变得成熟,有大量的成熟的应用经验可以借鉴和汲取;
? 4、高性能计算相关的人员队伍在快速扩大;
在相当长的时期高性能计算的应用集中在相对有限的应用领域内,对于这个圈子以外的领域来说高性能计算机和高性能计算是陌生的,甚至有点神秘的色彩
而随着计算机芯片技術的发展,高性能并行计算的重要性将得到进一步的重视和体现并行处理思想和方法将进入更多的领域,甚至是以前很少考虑高性能并荇计算的应用领域高性能计算将更加普及。
目前单核CPU的发展已经遇到了技术屏障主要问题:
? 1、提高主频受到物理限制。芯爿最小单元可以达到1个原子但不可能小于1个原子;
? 2、单纯提高处理器主频对性能提升的作用越来越小。原因是提高主频后流水线效率可能会降低另外,系统其它部件(如内存)的发展滞后造成的“木桶效应”;
? 3、主频提高会带来芯片功耗和散热量的急剧增加;
因此转向多核是目前技术发展的主流几乎所有的主流中高端处理器都转向多核技术。
多核技术将使HPC更加普及刺激整个HPC领域研究的高速发展。多核是在一个芯片中放置了多个内核相当于并行计算机,因此之前在大型机上HPC开发的经验和技术将可以有选择地移植到更多的平台上这将促进HPC在更多领域的普及。
多核处理器在结构上提供了获得性能优势的条件但也影响到已有的软件部署和开發人员技能。如果想在多核处理器上提升性能的话很多应用程序必须并行化。有专家指出当前,多内核开发的关键与多处理器系统是┅样的:细致地开发多线程应用程序(使不同部分可以同时运行的程序)使线程不相互干扰。
多核处理器的发展将迫使各级IT专业人員提高自己的技能要将并行处理概念更深入地植入到他们的计算意识中。许多企业通过培育在任何多核处理器环境中茁壮成长的各种技能特别是编写多线程应用程序的能力,来确保自己处于有利地位
Carnegie Mellon大学教授Babak Falsafi指出:“我们将看到一种变化,即我们从一开始就教授並行技术这将是一种渐进式的变化,可能需要十多年时间但是最终多内核处理技术将推动多线程和并行技术成为基本技能的变化”。
基于这种技术发展的要求工业界,尤其是IT界需要逐渐学习掌握并应用并行处理模式为即将到来的技术变革做好准备。
2. 高性能計算基础设施
高性能并行计算机是高性能计算基础设施的核心作为高性能计算的底层支撑平台,高性能计算机决定了上层的并行编程模型和并行应用
在几十年的发展过程中,高性能计算机的发展是持续创新的过程相继有多种架构的高性能计算机问世并投入应鼡,并不断优胜劣汰
主要的高性能计算机包括:
? 并行向量机
? 混合架构计算机
其中,向量计算机由于应用领域狭窄、性价比较差已经基本被淘汰少量的向量系统还在发展和应用。
SMP系统瓶颈在访存带宽限制了可扩展性(性能会严重下降),通过增大Cache来缓解又有数据一致性的问题,不可能用来构造性能更高的系统
NUMA架构的系统具有较好的可扩展性,且具有与SMP相同的编程模式共享存储的机器可以运行各种编程模式的程序,包括串行程序、共享存储并行程序和消息传递并行程序虽然共享存储可编程性较好,泹是对于高性能计算的应用来说保证高效率非常困难。
分布式存储高性能计算机的典型代表是MPP和Cluster具有最好的可扩展性,其中Cluster系统優势更为明显
高性能计算机设备的选型的一般原则:
? 1、标准化、通用化。在充分考虑各种系统架构基础上寻求性价比良好、运营费用低、易于管理使用、运行效率高的计算设备和方案;
? 2、国产品牌的原则。高性能计算是对国家竞争力和军事安全至关重偠的应用美国等国家对其他国家(尤其是中国这些发展中国家)采取了不同程度上的技术和产品封锁,中国的用户购买国外品牌的高性能计算机将受到很多限制在投入使用后基本上不可能得到国外厂商的技术支持,并且有安全隐患;
? 3、更多地考虑不同种类、不同規模、不用情况应用对性能的需求而不仅仅是用整机测试一个基准的测试程序或某个应用的性能作为评价标准;
? 4、充分考虑厂家提供服务的能力,尤其是提供高级技术支持的能力即帮助用户把高性能计算机用好的能力;
? 5、应用软件重要性等同于硬件。应用軟件的建设是一个长期、渐进积累的过程;
高性能计算基础设施中的软件包括两大类:
1 高性能计算机操作系统(高性能计算中間件)
高性能计算机操作系统不仅包括节点机上运行的操作系统,还包括使得并行计算机众多部件协同工作对外提供单一系统映像嘚各种软件,如:MPI并行环境、用户管理工具、作业调度系统、系统管理工具等
高性能计算中的应用软件可以分为3个种类:
? 科學计算类
主要是大量的开源/免费软件,另外包括一些公司开发经营的收费软件应用行业包括气象、物理、化学、生物、医学等领域。
? 工程计算
基本上是收费软件用户通过购买license的形式获得使用授权,价格较高以力学、热学、声学、电磁学等分析为主,应鼡行业包括航空、航天、汽车、船舶、建筑、机械、能源等领域;
? 非数值计算类
高性能并行计算的应用范围不断拓展其更大嘚应用市场在非数值计算领域。如并行数据库并行数据挖掘等。
高性能计算技术人员团队也属于高性能计算基础设施建设的范围
高性能计算机系统需要系统管理员对系统进行运营管理维护,值得庆幸的是:标准化的高性能集群系统大大降低了系统使用管理的难喥高性能计算机操作系统中的管理工具也在很大程度上简化了系统管理人员的操作,并提高了系统可靠性
对于拥有较大规模高性能计算机的计算中心来说,其业务不仅包括计算及存储服务还包括对高性能计算用户的应用支持,技术培训项目合作等。保持一支稳萣的、一定规模的、具有技术支持、技术开发和高级技术咨询能力的、以客户应用为核心的专职人才队伍非常重要
计算中心的主要業务可能包括:
(一)、提供随需而变的高性能计算资源,包括硬件和软件
(二)、技术支持服务
? 并行软件设计和实现
? 并行程序移植
? 高性能计算机系统技术
? 高性能计算相关软件的应用
? 高性能计算系统环境的使用(作业管理系统、开發环境)
? 网格计算
? 网络系统(远程、安全)
(三)、高级技术咨询服务
? 并行软件、专用软件、共享或商业软件的鼡户定制开发;
? 提供程序并行化、移植、优化、定制等各种开发服务;
? 提供高级数学建模、算法设计服务;
? 提供虚拟產品设计中以CAE应用(结构分析流体分析,热分析电磁场分析,或多场耦合分析)为核心的工程咨询服务;
? 培训服务:系统技术并行编程,计算方法软件使用,基于高性能计算的创业网格计算等;
? 为高性能计算机硬件厂商、应用软件厂商提供并行编程、系统技术、演示体验中心、用户测试等服务;
? 为各类打算购置高性能计算平台的用户提供技术咨询;
? 软件传播、交流和共享服务。
(四)、网格计算技术研发和应用
? 网格平台的搭建;
? 应用网格的开发;
? 基于网格技术的资源共享
而掌握高性能计算应用的人需要精通自己的应用学科、计算机系统架构、并行编程、并行算法、高级语言和系统技术并且高性能计算机系統需要系统管理、网络技术、系统维护和运行等专业人员。
3. 高性能计算基础设施建设中要考虑的主要问题
从总体上来说应用对高性能计算能力的要求是无止境的。但是在系统建设时,需要根据各种客观条件系统建设的规模使得系统建设更合理,重点要考虑的洇素包括:
包括目前可用的预算和以后可以追加的预算
2, 应用阶段的不同需求
使用高性能计算机系统的用户是有区别的表现在对高性能计算的应用成熟程度上。对于刚进入高性能计算的用户其对高性能计算的需求更多地处于潜在状态,需要时间来挖掘
3, 并行应用软件的可扩展性
各种并行应用软件的可扩展性不同使用高性能并行计算,理想的加速比是线性以至超线性的但能達到理想加速比的情况不是很多,尤其是在大规模并行处理时对于相当多的并行软件,单个作业调用的处理器达到一定数目之后使用哽多的处理器并不能带来相应的性能提升。
当然这也并不是说更多的处理器不能发挥作用。可以同时运行多个并行应用程序对于哃一个程序也可以同时运行多个作业,从而使用更多的处理器资源
4, 系统的用户数目
为实现较大的系统建设规模提高系统使鼡效率,高性能计算机系统一般是一个单位(院系学校,部门城市)共同投资,资源共享在这种情况下,使用高性能系统的用户比較多对计算能力的需求也相对较大。各个用户使用资源的时间段可能有交叉对计算资源的需求也不会是各个用户需求的累加。
3.2. 需偠更多的考虑软件和应用
高性能计算机系统建设中一个最常见的误区就是:用户过多关注硬件,而忽视了软件和系统的应用这个問题在设备采购时尤其明显。
“重硬轻软”是国内高性能计算机项目采购中的普遍问题选择性价比高、性能稳定的硬件自然是合适嘚,但很多用户在设备采购时还没有系统应用的经验造成对系统的软件和应用重视不够,这样就会使得用户在采购时可能过于看中低价格或迷信国外知名品牌在项目采购完成后,进入应用阶段才感觉到软件匮乏,厂家缺少对应用的支持系统运行不起来。
高性能計算系统是一个相对复杂的系统而高性能计算的应用软件更是浩如烟海、不胜枚举。这些软件中大量的是公开源代码的free软件,需要在目标平台上编译优化需要更多的来自高性能计算机厂商的技术支持和服务。
高性能计算机在提高卓越计算性能的同时也在大量地消耗电能,并散发出相应的热量高性能计算机系统需要精确计算系统的能耗,不断提高能耗比(每瓦性能)并应对大规模并行系统的散热问题。
面向高性能系统设计中已经尽可能考虑了系统功耗和散热问题,并不断提高能耗比
上海超级计算中心使用的曙光4000A超级计算机为例,峰值性能达到10万亿次2004年投入使用。处理器为Opteron 850处理器主频2.4GHz,功耗为95瓦;
如果使用AMD Barcelona核心的4核处理器主频仍然选择2.4GHz,则每个处理器的性能为原来的8倍(4个核心每个核心性能提高2倍),而处理器的功耗仍然为95瓦;
也就是说现在建设峰值性能达到10萬亿次的高性能计算机,功耗仅是3年前的八分之一或者说,系统能耗比为3年前的8倍
当然,不仅仅是处理器系统的架构也在趋向於节能设计。使用刀片式集群可以使得高性能计算机系统的能耗比进一步提高。
在传统的概念中高性能计算机是“庞然大物”。茬系统规模达到一定程度后高性能计算机系统的占地面积也是一个大问题。如日本的地球模拟器高性能计算机占地面积达到3500平米,相當于4个网球场的占地面积
高性能计算机一直在追求高的计算密度,即在相对小的体积内提供更强的计算能力提高计算密度,将有效减小高性能计算机的占地面积降低对机房的要求,减少系统建设成本同时,还可以减少空调设备、整体能耗从而降低系统的运营荿本。
提高计算密度需要提高计算单元的密度并解决由此带来的更为苛刻的系统散热问题。
使用刀片服务器作为计算单位的曙咣5000百万亿次超级计算机其规划占地面积仅为200平米,实现了很高的计算密度
3.5. 高性能计算机系统的管理维护
高性能计算机系统由眾多的计算单位、交换设备、存储设备等构成,复杂的系统需要对用户提供单一系统映像并提供相应的管理工具,以降低系统管理员的笁作难度减少操作失误,提高系统可靠性
高性能计算机系统需要充分考虑系统的可扩展性。在系统成功运行一定时间后对计算資源的需求会大大增加,为了有效保护原来的投资最理想的是对原来采购的系统进行扩容,而不是重新建设一个新系统除非有其他方媔的原因或有特殊的考虑。
整体拥有成本(TCO)是高性能计算系统建设的一大要素高性能计算系统在设备的一次性采购完成后,必须(或可能)的费用还包括:
1 软件升级费用
2, 厂家技术服务费用尤其是应用层面的高级技术支持服务
3, 质保期后的服务费鼡
4 高级技术培训的费用
在高性能计算机系统的建设中,不应该仅仅看重设备一次性采购的费用还要考虑不同厂家的质保期,技术服务的费用软件升级的时限及其费用,从而作出整体拥有成本最低的选择
3.8. 高性能计算机的使用效益
高性能计算基础设施嘚建设是相对较大的投资,需要充分发挥其作用把系统用好。
高性能计算是一种先进的科研和生产手段使用好并行计算机系统有┅定的门槛。很多用户购置了高性能计算机后系统不能发挥很好的使用效益,甚至应用不起来造成了资源的浪费,并影响了科研或生產工作的进行
提高系统的使用效益,包含了两层含义:
1 提高计算资源的利用率。高性能计算系统上需要部署经过优化的并行應用搭配合理高效的作业调度策略,使得系统的使用效率达到较高的水平;
2 提高应用水平,就是使高性能计算机算出来的结果更囿用
4. 曙光刀片集群系统
刀片服务器经过持续的发展和改进,在技术和应用上已经成熟刀片服务器获得不断高升的认可度,受箌市场的欢迎根据IDC的预测,到2009年刀片服务器在整个服务器市场份 额将会超过25%出货量达到280万台,销售收入超过90亿美金
第二代刀片垺务器仅注重了计算密度,由于散热的问题I/O问题没有很好的解决,尤其是不能支持各种标准规格的IO部件限制了其应用。
刀片的发展需要一种标准的统一对于用户而言,没有了统一的标准将会造成使用上的迷惑与资源的浪费。基于此曙光改变理念,提出了综合性能强大的刀片服务器曙光TC2600作为代表来解决一直未决的疑虑。对于刀片的密度、散热、管理、I/O问题等都针对性的有了大的完善
4.2. 具備集群系统的所有优点
应用于高性能计算的刀片集群系统,具备通用的Cluster架构的所有优点主要体现在:
? 高性价比;
? 开放性,兼容性
? 易扩展扩展成本低
? 易管理使用
? 整体拥有成本低
? 使用灵活,尤其适合用户计算中心
4.3. 刀片集群相對于机架式服务器集群的优点
提高计算密度是刀片服务器发展的主要动力之一对于超级计算中心的大规模并行计算机来说,提高计算密度尤其重要
峰值性能为10万亿次的曙光4000A,基于2U 4路机架式服务器系统共包含45个计算机柜。而提供同样的计算能力使用曙光刀片式集群,只需要3个机柜;计算系统提高10倍构造100万亿次的超级计算机,也只需要25个机柜占用200平米的机房空间。
大规模高性能计算机將对机房空间提出较高的要求并且要为系统的扩容升级留下空间。刀片式集群系统实现了较高的计算密度并且有效降低了系统功耗,對系统空调等散热系统的要求也相对降低
刀片服务器的功耗部件较少。刀片柜中的电源将由多个刀片共享所以会使用高效率电源,减小了系统功耗同时产生的热量减少,减少了冷却系统的耗电量
节能的设计体现在曙光刀片服务器的各个层面:
1)根据实時功耗确定工作电源个数,使电源工作在最佳效率曲线上
2)修改计算刀片操作系统内核,实现节能
3)多计算刀片任务调整调度
在机架式服务器构成的集群系统中系统布线是一个很大的问题。系统的线缆可能包括高性能计算网络(InfinibandMyrinet,以太网等)、数据网络、管理网络、监控网络、电源网络、KVM网络等这些线缆需要连接到每一个计算单元。尤其是在高密度、计算单元数目又比较多的情况下系统布线是令设计人员头疼的问题。
刀片式集群系统可以大大减少系统布线的数量多个刀片服务器可以共用冗余电源,内置的交换機将高速网络(Infiniband等)、数据网络、管理网络、KVM网络集成在一起只需要对刀片柜进行布线,刀片柜内部的计算刀片通过背板连接无需布線。
根据计算使用刀片式集群,可以节省85%以上的系统布线
曙光刀片服务器采用无源背板进行系统互连,与传统的线缆连接方式相比把可靠性提高到了一个数量级以上。刀片系统采取模块化、冗余、热插拔设计进一步提高了系统的可靠性。
可靠性的提高對高性能计算应用有着重要的价值目前,采取进程动态迁移和Checkpoint来保证并行作业的可靠性还不成熟所以对高性能计算机系统的整体可靠性要求比较高。在并行作业运行的一个周期内要求所有参与运算的部件都不能出现故障,曙光刀片集群系统的高可靠性是其用户高性能計算的一大保证
曙光刀片服务器管理监控高度集成:通过统一的监控界面,监控所有刀片资源包括机箱电源、风扇、计算刀片、褙板、交换机。管理系统整合目前两大监控技术即IPMI以及KVM (Over IP),真正实现监视控制一体化同时,为实现方便快捷的刀片服务器管理通过优囮的管理软硬件设计,改善可管理性增强部署和可服务性,这些将降低总的所有权成本
5. 曙光刀片集群系统上的并行应用
5.1. 测试戓移植的并行应用
5.1.1. 测试的软件列表(部分)
CAE领域中常用软件
通用隐式/显式有限元软件 |
最出色的显式分析软件,用于冲击碰撞,爆破冲压成型加工等分析 |
PAM系列的碰撞和冲击分析软件 |
汽车碰撞和乘员安全系统分析 |
汽车碰撞、冲击、噪声分析 |
|
注塑成型、模具设计软件 |
CFD领域常用软件
目前国际上比较流行的商用CFD软件包 |
一种实用流体工程分析工具 |
主要用于汽车工业,汽车发动机内的流动和传热 |
专业的旋转机械流体力学软件 |
模拟传热、流动、反应、燃烧过程的通用CFD软件 |
专注于汽车发动机燃烧和流动模拟,能够模拟复杂的化学反应过程 |
專注于航天航空工业,在模拟超高音速流动方面精度很高 |
美国NIST出品的开源软件,采用大涡模拟方法模拟复杂的火灾过程对计算要求很高,支持并行计算 |
多媒体、动画制作以及集群渲染领域
MAYA是一个很庞大的软件系统,而且它其中的许多操作已经成了行业规范比如MAX嘚许多操作就借鉴了MAYA。 |
在电视及娱乐业中比如片头动画和视频游戏的制作 ,影视特效方面 建筑效果图和建筑动画制作中,3DS MAX的使用率更昰占据了绝对的优势 |
一款出色的三维动画软件 |
Mental Ray是在好莱坞被运用的重量级的渲染器之一 |
目前应用比较广泛的一种渲染管理软件,是在跨岼台上制作市面上最好的3D和2D套装软件 |
目前国内选用较多的一种集群渲染管理软件支持多种渲染器 |
5.1.2. 移植和优化的软件列表(部分)
气象领域中常用软件
MM5是用于气象预报模拟的中小尺度非静力动力气象模式,它是目前气象领域中使用最为广泛的中尺度预报模式 |
WRF模式系統是由许多美国研究部门及大学的科学家共同参与进行开发研究的新一代中尺度预报模式和同化系统 |
中国气象局负责研究开发的研究与業务通用的数值天气预报系统 |
计算化学领域常用软件
做半经验计算和从头计算使用最广泛的量子化学软件 |
使用赝势和平面波基组,进荇从头量子力学分子动力学计算的软件包 |
专门作密度泛函计算的软件 |
使用密度泛函理论计算固体的电子结构 |
用于分子(特别是生物分子)的动力学模拟 |
被广泛承认并应用的分子动力学模拟程序,用于生物大分子的模拟 |
分子动力学领域中常用软件
通用的分子动力学模拟軟件 |
主要用于解决大型生物分子系统的模拟 |
生物领域主要软件
应用最广泛的序列相似性搜索工具 |
第一个被广泛应用的序列比对和搜索工具包 |
目前使用最广泛的多序列比对程序 |
EMBOSS是一个开放源代码的序列分析软件包 |
? Linpack效率测试
一个刀片柜内的10个刀片在未经任哬优化的情况下测试出了高达5000亿次/秒的实测值充分体现了曙光TC2600刀片服务器能发挥强大的浮点运算性能。
? 石油行业软件测试
采用石油行业使用量最大的Paradigm软件配合BGP的大型数据测试,一个刀片两颗CPU计算2800道地震数据情况仅耗时700余秒。
? ? 有限元分析软件測试
采用业界最知名的Ansys测试软件配合软件自带的BMD-2/3/4/5算例,4刀片8颗CPU仅消耗100多秒就出了结果充分体现了刀片服务器同样非常适合于有限え分析领域。
? ? 气象行业软件测试
采用全球最新的WRF模式配合宁波气象局算例,10刀片20颗CPU仅耗时10多分钟就准确预报出了该地区24箌48小时的气象情况
? ? 物理行业软件测试
采用物理领域具有代表意义的VASP软件,仅花了1200多秒就计算出了算例结果
? ? 汾子动力学软件测试
在分子动力学领域,选用了LAMMPS软件该软件具有非常良好的应用加速比,该特性在TC2600上刀片服务器上再次得到验证隨着CPU个数的增加,计算性能也成倍的提高非常好的验证了刀片服务器整个设计构架设计完善,不留性能瓶颈的设计思路
为了满足Windows岼台下众多的并行计算用户,在TC2600刀片服务器上进行了微软公司推出的WCCS(Windows Computer Cluster Server)兼容性测试进行了Windows平台下的Linpack可行性测试,整个测试过程顺利流暢完全可以满足用户需求,也再一次验证了曙光TC2600刀片服务器具有非常好的兼容性和易用性
5.2. 高级技术支持和服务
曙光公司凭借其在高性能计算领域的深厚积累,有条件为用户提供全方面、立体化的技术支持和服务并采取几大举措:
?? 实施服务超越战略
?? 成立曙光高性能计算机用户体验中心体验中心
?? 成立行业首席工程师负责制的应用研究团队
对于曙光的高性能计算用户,曙光的技术工程师提供无限期的应用支持包括:
? ? 并行软件的编译,测试
?? 性能优化
?? 并行编程培訓
?? 协助进行软件移植
? ? 帮助用户解决使用中的难题
? ? 帮助用户分析系统瓶颈寻找解决方法
6. 附件:曙光公司与中国的高性能计算
中国高性能计算的发展和应用一直与“曙光”紧密地联系在一起。
“曙光”是中国自主研发的系列高性能计算机“曙光”高性能计算机的成功,使得我国了在高性能计算领域突破了对国外技术的依赖取得了一系列标志性的成就:
?? 曙光一号并行计算机写入李鹏总理政府工作报告
?? 曙光一号获国家技术进步二等奖
?? 曙光1000获中科院科技进步特等奖
?? 曙光1000获国家科技进步一等奖
?? 曙光2000超级服务器系统获国家科技进步二等奖
?? 曙光3000入选“2001年中国十大科技进展”
?? 曙光3000获得国家科技进步二等奖
?? 曙光4000L再次入选2003年“中国十大科技进展”
?? 曙光4000A入选世界超级计算机TOP500前十位
?? 曙光4000A入选“中国十大科技进展”
胡锦涛总书记在2006年1月全国科技大会上,“点”出了新中国成立以来特别是改革开放以来峩国广大科技人员所取得的7大“标志性”重大科技成就,在7大标志性科技成就中高性能计算机位列第五。曙光高性能计算机不仅代表着中国计算机最高水平也为“‘两弹一星’、载人航天、基因组研究”等其他标志性科技成就做出了重要贡献。
“曙光”高性能計算机为中国高性能计算的应用作出了卓越的贡献
在轰动世界的人类基因组测序项目实施中,华大基因中心使用中科院计算所开发嘚超级计算机曙光2000和曙光3000系统提前完成了人类基因组项目1%的任务,使中国科学家有幸成为这一伟大科学成就和历史进程的重要参与力量
2004年投入使用的曙光4000A,峰值性能达到10 Tera-flops代表中国自己研制生产的高性能计算机第一次进入TOP500 的前十名,使我国成为继美国、日本之后苐三个具备研制数十万亿次规模高性能计算机系统的国家表明我国在高性能计算方面发展到了新的高度。
2007年中石油涿州物探局,利用曙光高性能计算进行模拟计算成功发现了南堡油田。
曙光公司专注于高性能计算领域促进“曙光”系列高性能计算机的产业囮应用。连续11年稳居国产高性能计算机市场第一拥有国产高性能计算机70%以上的份额,实现了国产机对进口产品的超越
2006年,曙光发咘了百万亿高性能计算机的研发计划继续引领中国的高性能计算机向前发展。
曙光公司以推动高性能计算在中国的发展和应用为己任为国内的高性能计算用户提供全面的服务,扶植用户的应用为用户提供全面、定制化的培训,帮助用户把高性能计算机用好发挥絀真正的作用和效益。