游戏推广的可靠性指南：衡量有效性、规避风险和优化结果

信途科技新闻资讯 2024-09-22 9 0

在竞争激烈的游戏市场中，推广你的游戏至关重要。随着越来越多的推广渠道和技术出现，衡量你的努力的有效性并规避潜在风险变得至关重要。

衡量推广活动有效性的指标

在评估游戏推广活动时，需要考虑以下关键指标：

转化率：衡量你的推广活动将潜在客户转化为实际玩家的有效程度。
用户获取成本 (UA)：计算每位新玩家的获取成本，这是评估你推广活动成本效益的重要指标。
留存率：跟踪玩家在一段时间的参与情况，这有助于了解你的推广活动是否有效地吸引长期用户。
收入：直接衡量你的推广活动对游戏产生的收益，包括应用内购买和订阅费。
品牌知名度：评估你的推广活动是否成功提高了游戏的知名度和用户意识。

规避推广风险的策略

为了确保你的游戏推广活动的可靠性，请考虑以下规避风险的策略：

多元化渠道：不要依赖单一的推广渠道。利用多种平台和技术，如社交媒体、应用商店和影响者营销，可以降低你的风险敞口。
设置预算：提前明确你的推广预算，并定期监控支出，以避免透支。
追踪效果：使用分析工具，例如 Google Analytics、Adjust 和 AppsFlyer，来追踪你的推广活动效果。这将使你能够实时调整你的策略。
避免作弊：与信誉良好的广告网络合作，并确保你的推广活动符合广告政策。欺诈行为可能会损害你的品牌声誉并导致你的活动被封禁。
收集反馈：收集玩家关于你的推广活动的反馈。这将帮助你确定改进和优化你的策略的领域。

优化推广结果的最佳实践

为了最大限度地发挥你的游戏推广努力，请遵循以下最佳实践：

了解你的受众：确定你的目标受众并根据他们的兴趣和行为定制你的推广活动。
制作引人入胜的内容：创建高质量、引人入胜的内容，如视频、截图和博文，以吸引潜在玩家。
利用社交媒体：建立一个强大的社交媒体形象，与你的粉丝互动，扩大你的影响范围。
考虑影响者营销：与游戏影响者合作，推广你的游戏并获得新玩家。
优化应用商店页面：优化你的应用商店页面，包括吸引人的标题、描述和截图，以提高你的排名和转化率。

结论

通过遵循这些可靠性指南，你可以衡量游戏推广活动的有效性、规避风险并优化你的结果。通过不断监测、调整和改进你的策略，你可以在竞争激烈的市场中建立成功的推广活动，提高用户获取量、留存率和收入。

区块链如何分析市场需求(区块链的市场分析)

在你看来，区块链前景如何

行业主要企业：中国平安()、东港股份()、信息发展()、远光软件()、博思软件()、飞天诚信()、四方精创()、工商银行()、顺丰控股()

本文核心数据：中国区块链市场规模、中国区块链招标数量、中国区块链企业数量

行业概况

1、定义

狭义来讲，区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构，并以密码学方式保证的不可篡改和不可伪造的分布式账本。

广义来讲，区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算方式。

区块链并不是一项单一的技术，而是一个新技术的组合。其中每项技术都各司其职，解决了不同难题，组合在一起形成了区块链。区块作为区块链的基本结构单元，由区块头和包含了交易数据的区块主体两部分组成。

2、产业链剖析：下游行业涉及范围广

区块链产业链的上游主要是底层的技术及基础设施。底层技术包括核心基础组件、协议和算法。以比特币、莱特币、以太坊为代表，搭建了基于区块链技术的分布式算法、数字秘钥、数据存储、P2P网络协议、共识机制等网络环境、交易规则及矿工加入网络节点的奖励机制，代表性企业有小蚁、量子链、万象区块链等;基础设施则主要是矿机。

中游则是平台层，主要是面向开发者提供基于区块链技术的应用，是在底层技术的基础上提供智能合约、信息安全、数据服务等产品化服务，提高开发者在平台层开发应用的便捷性和可拓展性。

下游则是垂直行业应用层。表现为核心应用组件，包括智能合约、可编程资产、激励机制、成员管理等。

行业发展历程：正处于区块链3.0时代

从全球区块链的发展历程来看，2008年，署名为“中本聪”的匿名人士发表论文《比特币：对等网络电子现金系统》，最初期望是推出一种可以自由流通的点对点电子现金，比特币的发行代表了区块链技术的开端;之后在2013年以太坊的推出，直接推动区块链进入到2.0时代;2017年底，稳定币的流行以及及MakerDAO上线，推动区块链进入3.0时代，到2019年6月，Facebook发布Libra白皮书，引起全球各界的关注与讨论，各国监管部门先后发声，显示出区块链技术在重塑全球金融基础设施方面的巨大潜力。进入2021年后，基于NFT的标识技术兴起，率先在艺术领域展开应用。

行业政策背景：推动区块链全方位发展

2016年，国务院发布《“十三五”国家信息化规划》首次将区块链列入新技术范畴并作前沿布局，标志着我国开始推动区块链技术和应用发展。此后国家个地方接连出台区块链相关政策，为区块链的发展提供了良好的环境。

2019年2月，国家互联网信息办公室发布的《区块链信息服务管理规定》正式施行，规范了我国区块链行业发展所发布的备案依据。出台《规定》旨在明确区块链信息服务提供者的信息安全管理责任，规范和促进区块链技术及相关服务健康发展，规避区块链信息服务安全风险，为区块链信息服务的提供、使用、管理等提供有效的法律依据。本次“管理规定”的出台也意味着我国对于区块链信息服务的“监管时代”正式来临。

2019年10月底，中共中央政治局就区块链技术发展现状和趋势进行了第十八次集体学习，中央领导明确强调把区块链作为核心技术自主创新的重要突破口，加快推动区块链技术和产业创新发展。这充分表明了区块链技术已上升到了国家高度。在中央政治局集体学习上做讲解的浙江大学教授、中国工程院院士陈纯，10月12日在由中国计算机学会主办的2019CCF区块链技术大会上表示，国内区块链产业发展正迎来“春风”，中国区块链技术的研究热点将集中于联盟区块链的关键技术、区块链监管技术两个方面。

行业发展现状

1、2020年市场规模增速超90%

2016-2018年，大型IT互联网企业纷纷布局区块链，初创企业进入井喷模式，产业规模不断扩大，根据IDC的数据，中国区块链行业经历了从2017年的0.85亿美元级别市场规模，到2020年的5.61亿美元级别产业规模的改变。

2、相关企业数量快速增长

在企业数量方面，2020H1我国提供区块链专业技术支持、产品、解决方案等服务，且有投入或产出的新增区块链企业数量达303家，全国同比增长274.07%。截至2020年末，我国区块链相关企业数量达到家，同比增长52.88%。

3、区块链金融是最大下游应用市场

根据《中国区块链发展白皮书(2020)》的披露，随着区块链应用落地加快推进，“区块链+”业务已经成为互联网骨干企业进军区块链行业的发展重点，在金融业务之外，积极部署互联网、溯源、供应链物流、数字资产、政务及公共服务、知识产权、法律、医疗等多领域的应用。其中，金融是区块链技术应用场景中探索最多的领域，在供应链金融、贸易融资、支付清算、资金管理等细分领域都有具体的项目落地。

4、区块链招标数量逐年增多

从年份来看，2016-2020年，政府在区块链相关项目上的招标数一直呈指数型增长，一方面得益于区块链技术的应用价值日益凸显，另一方面也体现出政府对于区块链的需求和重视程度都有所增加。

行业竞争状况

1、区域竞争：北京广东区块链技术研发相关企业分布最多

在公司分布方面，截至2021年上半年，企业分布阶梯化明显。其中北京、广东分别以348家和341家区块链开发相关企业位居第一梯队，江苏、上海、浙江企业数量分别达164、127、81家。

区块链产业园区作为区块链产业集群发展的重要载体，各地方政府正在加快推进建设。从产业园的位置分布来看，北京、上海、杭州、广州、重庆、青岛、长沙等城市区块链产业园区数量较多，形成以北京、山东为主的环渤海聚集效应，以浙江、上海、江苏为主的长江三角洲聚集效应，以广东为主的珠江三角洲聚集效应和以重庆、湖南为主的湘黔渝聚集效应。结合产业园的定位发展，均是以为企业服务为前提，打造区块链创新平台和产业高地，这样的定位也为企业的聚集效应提供了基础。

2、企业竞争：阿里巴巴区块链实力最强

2021年3月，在中国移动通信联合会区块链专业委员会、中国科技体制改革研究会数字经济发展研究小组和中国区块链企业百强榜组委会指导下，链塔智库从数千个项目、企业名单中进行筛选、评估，最终发布2020中国区块链企业百强榜。

在2020年疫情爆发的大背景下，2020年区块链百强榜对企业考察的维度进行了一定程度的调整，以突出2020年度优秀区块链企业的表现。其中分为五大主要维度，分别是商业经营权重占比25%，技术研发权重占比20%，产品应用权重占比30%，团队组成权重占比15%和市场推广占比10%。

行业发展前景及趋势预测

1、目前仍旧处于导入期

目前，我国区块链行业正处在导入期，行业呈现出两个主要特点：一是大型行业企业积极应用区块链技术来改进其自身的业务，但仍以尝试为主，主要的应用场景也都为行业中的非核心业务。如中国平安、中国银联、蚂蚁金服等企业在区块链应用探索中仅限于非核心业务;二是以区块链技术服务为主的企业的业务发展大多处在起步阶段，产品技术体系和商业模式还不够成熟，需求方对区块链的认识还有待提高。区块链在司法存证、政务管理、民生服务、食品溯源、供应链管理等场景中已经形成了一些应用案例，但还有待进一步优化和完善。

2、预计2026年市场容量超160亿美元

区块链技术是中国新一代信息技术自主创新突破的重点方向，蕴含着巨大的创新空间，在芯片、大数据、云计算等领域，创新活动日趋活跃，创新要素不断积聚。区块链技术在各行各业的应用不断深化，将催生大量的新技术、新产品、新应用、新模式。

中国以加快转变经济发展方式为主线，更加注重经济质量和人民生活水平的提高，采用包括区块链技术在内的新一代信息技术改造升级传统产业，提升传统产业的发展质量和效益，提高社会管理、公共服务和家居生活智能化水平。未来巨大的市场需求将为区块链技术带来难得的发展机遇和广阔的发展空间。研究员整理分析认为，中国区块链市场将保持高速增长，2021-2026年市场规模年复合增速达73%，2026年的市场规模将达163.68亿美元，且在未来20年，中国区块链行业市场规模有望达万亿级别。

以上数据参考前瞻产业研究院《中国区块链行业市场前瞻与投资战略规划分析报告》。

区块链+供应链金融：市场竞品分析

一、行业背景

供应链金融是银行将核心企业和上下游企业联系在一起提供灵活运用的金融产品和服务的一种融资模式。供应链金融上下游的融资服务通常围绕核心企业所展开。由于核心企业通常对上下游的供应商、经销商在定价、账期等方面要求苛刻，供应链中的中小企业常出现资金紧张、周转困难等情况。解决中小微企业资金流通困难的问题，风控是互联网供应链金融平台最大的困扰。这也导致了在：应收账款类、预付类、存货融资和信用贷款四种融资类型中，以应收账款类规模最大。

传统供应链金融核心痛点：

1.供应链上游中小企业融资难、成本高

核心企业的应付账款资产无法逐级流转，保理业务不可贯穿整条供应链。二、三级供应商资金需求得不到满足导致产品质量问题

2.商票使用场景受限，转让难度较大

商票的使用受制于企业的信誉，贴现的到账时间难以把控；供应商之间的结算约定，缺少系统化的自动触发机制；在多环节参与的供应链金融业务中，对回款保障缺少可信的技术手段

3.金融机构操作风险与成本较高

金融机构在贸易背景核实、可靠质权、回款控制等方面操作与风险成本均较高，而贸易链条中的企业或平台又难以自证，金融机构开展供应链金融业务的成本、风险和收益较难平衡

二、市场规模

据艾瑞最新的《2018年中国供应链金融行业研究报告》显示：

在我国，工业企业的应收账款已经具备一定的体量，为开展相应的供应链融资奠定了基础。然而，供应链融资的规模远不及基础的应收账款融资规模。

而根据调查显示，中小企业贷款需求指数持续大于50%，说明企业融资需求持续存在。

三、确定竞品

区块链技术是一种分布式账本技术，具有去中心化、不可篡改、高安全性和智能合约等技术特征，保证信息的完整与可靠性，能够有效解决交易过程中的信任和安全问题。

1.核心企业在区块链上对资产的确权，包括债权凭证真实有效性的核对与确认，区块链不可篡改的特点保证债权凭证本身不能造假，证明债权凭证流转的真实有效性，可逐级进行拆分转让，实现核心企业的信用穿透，从而解决链上供应商企业融资难的问题。

2.链上数据均可追溯根源，节省了金融机构大量的线下尽调、验证交易信息真实性的人力物力成本，为银行或互联网金融机构的风控系统补充。供应商依托核心企业的信用传递，能享受更快捷高效的融资服务，有效解决融资难融资贵的问题。

3.在这个信任的生态中，核心企业的信用可以转化为线上数字权证，通过智能合约防范履约风险，使信用可沿供应链条有效传导，降低合作成本，提高履约效率。更为重要的是，当数字权证能够在链上被锚定后，通过智能合约还可以实现对上下游企业资金的拆分和流转，极大的提高了资金的转速，实现自动清算。

目前国内已经有多家企业从区块链技术着手，布局供应链金融市场，我们选取以下4个竞品进行剖析研究，分析区块链+供应链金融的解决方案。

微企链：截至2018年10月底，融资金额近300亿元，供应商近3000家。

中企云链：已注册企业家；开立云信681亿元；保理融资360亿元；累计交易2016亿元。

中建电商+招行：有效交易136笔；融资总金额万。

浙商银行“应收款链平台”：截至2018年6月末，浙商银行应收款链平台已辐射企业1800多户，累计签发2600多笔应收款，金额合计260多亿元。

四、竞品核心功能分析

1、微企链：让你的应收账款流动起来

产品介绍：

微企链以源自核心企业的应收账款为底层资产，通过腾讯区块链技术实现债权凭证的转让拆分。其中，在原始资产登记上链时，通过对供应商的应收账款进行审核校验与确权，确认贸易关系真实有效，以保证上链资产的真实可信。债权凭证可基于供应链条进行层层拆分与流转，每层流转均可完整追溯登记上链的原始资产，以实现核心企业对多级供应商的信用穿透。

业务流程：

1.核心企业注册认证

2.平台审核、银行授信批额度

3.核心企业与微企链系统对接

4.核心企业发布ABS/ABN需求

5.供应商注册认证

6.提交发票+合同，申请资产发行

7.微企链平台有专门的团队进行资产材料审核

8.审核通过后提交核心企业确认付款

9.由核心企业付款承诺确认后，供应商则可持有债权凭证

10.供应商可将凭证支付给上游结算、或申请保理融资、或持有到期

/ABN到期后根据债权凭证进行清分付款

风险控制：

1.底层资产经资深专业团队的审核筛选

2.核心企业付款承诺

3.银行授信支持

4.支付结算由腾讯财付通技术支持，按约定实现

产品体验：

微企链没有具体操作界面可以体验。供应商的注册入口是小程序。微企链官网/联易融官网上面也只是留下了“联系我们”的入口。推测该平台并不对外开放，需为目标合作客户方可进行合作。

目前微企链的运营模式主要是跟联易融合作发布ABS/ABN，供应商在平台上去发行资产，申请融资。这种模式大大降低了整个产业链的融资成本。

2、中企云链：云信，世界因你而不同

产品介绍：

云信是中企云链平台上流转的企业信用。是由大型企业集团通过中企云链平台，将其优质企业信用转化为可流转、可融资、可灵活配置的一种创新型金融信息服务。

业务流程：

1.核心企业注册认证

2.平台审核、银行授信批额度

3.核心企业在额度下，根据应付金额开立云信，承诺到期付款

4.供应商注册认证并开立现金管理结算账户

5.供应商接收云信

6.供应商可将云信支付给上游结算、或申请保理融资（提交发票+合同）、或持有到期

7.核心企业到期偿付云信并清分至持有方

风险控制：

1.银行授信支持

2.核心企业付款承诺

3.中信银行自动万层支付清算

产品体验：

可参考公众号推文《云链金融-用户操作手册》

中企云链的宣传主要集中于云信这一载体，云信=现金（随意拆分）+商票（绝对免费）+银票（高可靠）+易追溯性，很好地提炼出来“云信”作为一种新型的电子结算工具的优势。同时，借用了区块链的概念去证明数据的不可篡改和可追溯性。

从中企云链微信公众号的动态来看，目前云信正全国大面积推广。据中企云链董事长刘江称，目前目前有一个两百人的地推团队，明年会布局到五百人。大概算下全国值得做供应链金融的核心企业五千家，一个人联系十家企业，五百人把这五千家核心企业抓住，就基本可以把整个中国的供应链金融覆盖了。详情可点击查看。

3、中建电商+招行：去中心化的供应链金融反向保理系统

产品介绍：

中建集团供应商在中建电商“云筑网”平台完成招标、签约、订单等采购流程后，即可同步将供销资料存证至协作平台。当供应商需要进行应收账款融资时，在协作平台上向银行提交融资申请，智能合约自动勾链存证信息，为融资银行提供完整可靠的审贷资料。融资审核通过后，银行将放款信息链上回复给供应商。融资到期后，供应商通过协作平台完成融资还款过程。

业务流程：

1.中建集团直属局公司、子公司的有效融资业务数据以及采购数据实时上链

2.供应商注册认证

3.申请应收账款融资

4.平台根据应付帐款自动获取对应的贸易数据包括订单、合同等

5.融资银行审核通过后放款

6.到期核心企业直接付款给银行

风险控制：

1.银行授信支持（未提及，但应该有）

2.核心企业付款承诺

3.区块链上采购数据证实贸易真实性

4.核心企业反向保理

产品体验：

可参考文章《携手共“筑”区块链建筑行业新模式》

该产品与上述产品不同，它合作的核心企业目前只针对中建集团直属局公司、子公司，且其融资服务只服务至与核心企业直接发生贸易往来的一级供应商，业务模式则是以链上数据作为融资材料的佐证，同时区块链保证的数据的不可抵赖和难以篡改，降低融资风险。

4、浙商银行应收款链平台：让企业应收账款转化为电子支付结算、融资工具

产品介绍：

应用区块链技术，创新开发应收款链平台，将企业应收账款转化为电子支付结算和融资工具。

业务流程：

1.付款人向收款人签发与承兑应收款，签发时需约定签收有效期，有效期不超过应收款到期日

2.收款人在签收有效期内签收确认。

3.签收后应收款方可进行保兑、支付、转让或贴现等操作

4.在应收款到期日前，经收款人同意后，可退回未经支付、转让和贴现的应收款

风险控制：

1.银行授信支持

2.核心企业付款承诺

产品体验：

浙商银行基于趣链科技底层区块链平台Hyperchain开发的“应收款链平台”上线。该平台是利用区块链技术将企业应收账款转化为在线支付和融资工具，帮助企业去杠杆、降成本的一款创新金融科技产品。专门用于办理企业应收账款的签发、承兑、保兑、支付、转让、质押和兑付等业务。

五、运营及商业化

在这里。我们借助商业画布来全面地分析竞品的商业化模式。

六、结论

区块链+供应链金融的产品的商业模式和业务流程其实大同小异，也很容易模仿，除了本文中提到的，还有布比区块链，趣链的生意家/西美链等等等等，但是能做大做强的，是要拼资源，这个业务模式，注定是要由议价能力最高的核心企业来牵头做起，那么你能引入多少核心企业的资源，这个核心企业的体量是否足够大，就看你平台的业务能力了。

做这个竞品分析主要是为了研究里面的业务模式以及商业运营，实际上里面水还很深，并不是简单花了流程图+资金流什么的，就能够去复制人家的业务模式了。

目前还在学习探索中，欢迎各路大神批评指正和交流！

区块链前景如何，未来在哪里

前景：中国国家层面一系列的动作，足以说敏，全球区块链标准未来将以中国为主导成为了中国很大的一个目标，中国在错失互联网话语权之后，不能再错失区块链的话语权。目前区块链项目除了美国之外，中国是最多的。早在19年就有报道指出，中国掌握了全世界三分之二的加密算力，中国已经表决通过的《密码法》也是中国掌握区块链标准的一次周密布局。不久的将来，这是必然会实现的结果。这意味着，中国的大学生们如果参与进该领域的建设，将能够搭上国家政策的顺风车，参与进世界最顶尖的行业搭建中，成为建设该行业的主力军!

未来判断：国家政策的扶持，毋庸置疑，随之而来的将会是资本市场的疯狂追逐。其实这个是可以参考互联网的发展历程的，任何一个新兴的朝阳产业都会成为资本追逐的对象。资本当初是如何逐鹿互联网的，如今也会上演同样的群雄逐鹿区块链大戏。

大家公认的区块链最大的应用场景就是金融行业了，因为伴随着区块链诞生的比特币，最大的属性就是金融属性。而政务系统使用区块链技术能够解决很多的办事难，信息不流通，节省更多的成本和时间，所以在这两个行业先行试点，也是符合区块链的特点和需求点的。

另外，随着区块链技术的不断成熟，除了这两个行业外，区块链将会快速渗透到各行各业，解决行业痛点，例如：游戏行业，解决游戏资产产权问题；制造行业，解决假品牌供应的问题；医疗行业，解决医疗档案互通问题；金融行业，解决快速跨境支付问题；金融专业背景的学生将会是第一批可以享受到行业就业红利的群体，之后随着技术的成熟，无论什么专业背景的学生，也将能够参与其中。但，传统专业背景的学生也严重缺乏区块链的相关知识，想要享受到红利，必须进行区块链知识的补充。

产品的可靠性指标有哪些

这是我以前的一个回答：我只是个学生，只是喜欢找了些资料觉得还好，希望能对你有帮助可靠性即产品在规定的条件下、在规定的时间内完成规定的功能的能力，是衡量产品品质的关键要素之一。 H3C在该领域经过多年的实践和积累，教训很多收获更多。本文以H3C产品为例，就通信产品硬件工程类的可靠性保证作简要探讨，借此让大家对通信设备以及H3C产品从研发到量产的可靠性过程有个初步了解。随着互联网的普及，网络正成为人们工作和生活越来越重要的组成部分。人们用它听歌看电影玩游戏，企业用它建立运营体系、存储数据、下发生产指令。试想某天当我们无法上网时，会是怎样的境况？你将无法在MSN上和好友畅聊，无法在Google地图上查找交通路线，无法在家了解股票行情……习惯依赖互联网的我们将不得不改变生活方式。对于企业来说，停机除造成直接的经济损失外，还可能引发社会影响和信任危机。美国Infonetics Research对80家大型企业调查发现，由网络故障造成的损失平均占年销售额的3.6%。就像电话一样，人们希望网络也能“想用就用”，可靠性的专业术语就是“可用度高”。实现高可用网络的方法，除了像冗余备份、提高故障诊断能力、增加备件这些减少设备宕机时恢复时间的方法之外，还包括一个重要的指标就是设备的可靠性。可靠性管理：可靠性保证和增长的基础之所以把可靠性管理放在第一位，优先于可靠性设计、分析和试验，是因为我们认为后者都是具体的、细节的技术或方法，是可以短期内修正或完善的，而可靠性管理则代表了一个公司可靠性领域在流程和制度上的成熟度，需要时间、实践、经验和数据的积累和沉淀，可以说是员工心智和公司文化的体现。 H3C经过两年的实践摸索，于2005年正式将可靠性纳入公司的流程管理，作为产品开发过程中的重要一环。对于研发的每款产品，我们都会制定相应的可靠性规格和过程实施计划。可靠性规格是产品概念阶段在可靠性指标上的承诺，根据各方面的需求决定出要做什么样的产品。可靠性过程计划则明确定义什么阶段、由谁、完成哪些可靠性工作，达到什么目标，过程如何规范，交付哪些内容，在执行上保证了规格承诺的兑现。举例来说，器件管理和优选便是可靠性管理体系中的重要组成部分。做过产品开发的人都知道，不同厂家的同型号器件，往往很难做到所有参数完全一致。当器件参数不一致时，产品在设计初期就需要考虑通过容差设计来兼容这些器件，这样就对设计和制造提出了更高的要求，一定程度上提高了设计制造的难度和成本。随着供应商和器件型号的增加，管理费用迅速上升，彼此沟通变成了一个费时费力而且低效的工作。另一方面，设计和制造也不断出现由“兼容设计”引起的问题，允许免检直接入库的器件变少。对于这种问题，在H3C，有专门的部门负责器件优选和认证管理工作，他们跟踪业界器件技术发展的动态，对制造、客户出现的器件问题进行跟踪和数据搜集，提供各类优选器件清单，使器件选型工作简单有效。当有器件需要替代时，必需经过足够的审核、测试和小批量验证才能被规模使用。可靠性增长的一个重要方法是应用FRACAS系统（Failure Report Analysis and Corrective Action System），其原理是利用“故障反馈、闭环控制、预防再发生”，通过一系列规范化的工作程序，及时报告产品故障，分析故障根因并纠正，通过临时规避措施减少故障的影响，通过预防再发生的解决措施实现产品可靠性的增长。在H3C，从研发、试产、生产到客户现场，各环节不同程度都在实施故障报告和闭环。以HASA（Highly Accelerated Stress Audit，高加速应力稽核）流程为代表，该流程融入了FRACAS和8D的思路，对每一台HASA过程出现问题的设备，都建立流程跟踪，从条码记录、故障现象、故障风险分析、根本原因总结到解决措施、闭环实施，把各环节有机整合起来，实现发货前检验的高效率和问题闭环的有效性。将每个HASA失效都看作改进过程的机会，从而使解决问题的投入达到利益最大化。有人说，世界上只有上帝可以不用数据说话。根据流程，我们把所有和可靠性相关的关键数据都集成到了QA系统的可靠性模块。在这里，可以查到某款产品在特定发货时间的市场失效情况，可以跟踪市场实际MTBF、累计失效率、制造批次相关的失效率等等。通过数据分析和同类产品比对，去发现设计、制造、管理各环节可以提高的机会，实现进一步的可靠性增长。良好的可靠性管理通过建立一套严格的纪律，指导我们什么时候要做什么事情；可以让今天的教训成为明天的预防，在明天就“一次性把事情做对”；可以让我们“站在巨人的肩膀上”，做任何事情都不是从零开始。而所有的目的，只是为了实现可靠性目标的承诺，保证提供给客户的产品，在承诺的时间内是高可靠的、是满足客户要求的。可靠性设计：关注细节，重在执行谈到电子产品可靠性设计，我们几乎马上会想到热设计、元器件降额、容差容错设计、可靠性预计等等。就像小学作文，中心思想是确定的，关键看如何写这篇文章。可靠性设计是否成功，有两点必不可少，其一是执行，其二是细节。我们先说执行。以降额设计为例，不少公司都有降额设计规范，看上去很美。但这个规范是否被严格执行了还是被束之高阁，超出降额的器件有没有被专业评估，降额要求是否根据制造/市场元器件的表现调整，不同产品是否需要分别对待实现全寿命成本最优，都是可靠性实现的关键。再如热设计，在H3C，热设计由可靠性工程师保证。每款产品，在开发初期，都会对散热进行评估和仿真，提前释放散热风险。在整个评估过程中，可靠性工程师和结构工程师、产品开发人员、互连设计工程师的沟通是非常紧密的。风险没有释放，就不能通过下一个技术评审点。其次是细节。航空爱好者知道，1980年，阿丽亚娜火箭第二次试飞时，一名工作人员不慎碰落一个部件的商标，堵塞了发动机燃烧室的喷嘴，造成发射失败。 1985年，美国发射“三叉戟”导弹，由于发动机燃烧室中剥落了一块黄豆大的绝缘层，结果高温火焰烧穿了那里的金属壁，燃气向外喷射，发动机爆炸。可靠性设计是一个需要注重细节的工作，所谓“千里之堤，溃于蚁穴”，“Paying attention to details”是直接写入到美军标338中的，或者这也是经验和思考的总结。以H3C为例，热设计中的热仿真过程不但仿真常态情况，还会对风扇停转等异常状态进行仿真；在降额设计上，对各类器件电应力进行遍历审查，对不同风扇转速下热应力进行遍历测试，保证在规定环境下每个器件承受的应力满足降额要求；对易损耗的器件进行寿命评估，保证在规定时间内设备符合用户的要求；对关键电路进行容差设计和仿真，保证器件参数随环境应力、寿命漂移时，电路依然可以可靠工作。可靠性分析：防患未然，心知肚明可靠性分析主要包括三部分：可靠性预计、FMEA（故障模式影响分析）和FTA（故障树分析）。可靠性预计通过MTBF、返修率等指标作为维修、备件成本的预计，或整网可用度的评估，对设备可靠性增长贡献不多。 FTA构造繁杂、对人员经验和技能要求高、容易出错。对于复杂产品，FMEA是一个防患未然的有效方法。举个简单的例子，我们有时会遇到十字路口红绿灯失效的情况，想想我们最不希望哪种失效现象出现？显然，当两条路上同时出现绿灯时交通事故隐患就被埋下了，这是我们最不希望发生的。那么在开展交通信号灯控制系统的FMEA分析时，就要关注哪些器件失效会出现绿灯同时点亮的情况，是否有解决方法。在H3C，复杂系统会开展FMEA分析工作，从而对系统中可能出现的故障现象做到心知肚明，评估容错设计是否足够。对于冗余备份系统，保证失效发生时设备可以快速倒换，业务正常运行不受影响。可靠性试验：真金不怕火炼我们研发出来的每一款产品，都会经受可靠性试验的洗礼，其中最严酷的当属HALT试验（Highly Accelerated Life Test，高加速寿命试验）。 90年代HALT试验在国外获得推广，而国内企业由于各种限制起步相对较晚。与传统的施加模拟客户环境的应力来发现故障的环境试验不同，高加速应力是一种主动的试验。使用应力步进的方法，使设备不断接近极限应力，直到故障暴露。通过“暴露缺陷—不断改进—再试验—再改进”的方式，持续发现并解决设计、来料、工艺等相关问题，从而获得产品的快速稳定。这有点像运动员的训练，如果要参加100米短跑比赛，那么运动员平常训练时绝不会只是重复训练100米冲刺，力量和耐力的训练必不可少。同样道理对于产品来说，虽然标称工作环境是0～40/45℃，HALT试验过程中其实都会经受100℃高温和-40℃低温的极限考验。到这里，可能你会提出两个问题：1，HALT试验做到-40℃和100℃有没有必要，室内应用的产品，怎么可能有这样的环境？经验告诉我们，非常必要且获益匪浅！按照H3C工程师的说法，现在不作HALT试验“心里没底”。 2，厂家宣称的0～70℃的器件能在-40～100℃环境工作吗？实践表明，在可靠的电路设计下，器件完全可以承受比规格更高的应力（极少数器件例外）。如果你是做可靠性的同行，或者正在经受HALT问题的煎熬，可能还有第3个疑问，为什么可以用环境应力暴露未来5年甚至10年可能出现的可靠性问题？研究一下元器件资料，看看容差设计的原理和品质管控方面的书籍，就会发现一个共同点：器件参数漂移。当一个器件在极限环境应力下参数漂移范围比工作5年参数漂移范围更宽时，只要该器件在电路环境中能承受极限应力，你就基本可以放心未来5年参数漂移引发失效的模式不会在电路中发生。其他原因如振动累计损伤、磨损引起的失效加速分析等，这里不再展开。除了HALT试验，在H3C，我们还采用了一个时尚前卫的可靠性保证手段，那就是HASA筛选。研发出来的产品，到量产后，由于器件批次间的参数离散、工艺控制的原因，可靠性有可能会降低。 HASA利用温度、振动、电应力、数据流量等多应力同时施加的方式，有效筛选出故障设备，从而实现量产产品在质量和可靠性上的快速稳定。我们通常的HASA筛选应力远超出设备工作应力，比如温变率，典型应用环境温变率不会超过0.5℃/分钟，H3C筛选应力是40℃/分钟。其他常规试验如温湿度类试验、机械类试验、EMC的浪涌/静电/抗干扰试验，都是H3C产品的必检项，通不过这些试验，产品是无法到达客户手中的。结语行文至此，相信你已对通信设备以及H3C产品可靠性保证体系有了简单了解。钢铁铸就源于千锤百炼，打造质量卓越的产品永远是我们孜孜以求的目标。参考资料：钢铁是怎样炼成的？——浅谈通信产品的可靠性保证

云原生体系下Serverless弹性探索与实践

简介：SAE通过对弹性组件和应用全生命周期的不断优化以达到秒级弹性，并在弹性能力，场景丰富度，稳定性上具备核心竞争力，是传统应用0改造上Serverless的最佳选择。

Serverless时代的来临

Serverless顾名思义，是一种“无服务器”架构，因为屏蔽了服务器的各种运维复杂度，让开发人员可以将更多精力用于业务逻辑设计与实现。在Serverless架构下，开发者只需要关注于上层应用逻辑的开发，而诸如资源申请，环境搭建，负载均衡，扩缩容等等服务器相关的复杂操作都由平台来进行维护。在云原生架构白皮书中，对Serverless的特性有以下概括：

全托管的计算服务，客户只需要编写代码构建应用，无需关注同质化的、负担繁重的基于服务器等基础设施的开发、运维、安全、高可用等工作；

通用性，能够支撑云上所有重要类型的应用；

自动的弹性伸缩，让用户无需为资源使用提前进行容量规划；

按量计费，让企业使用成本得有效降低，无需为闲置资源付费。

回顾整个Serverless的发展历程，我们可以看到从2012年首次提出Serverless概念为起点，再到AWS推出Lambda云产品的这段时间内，人们对Serverless的关注度出现了爆发式的增长，对无服务器的期待和畅想逐渐引爆整个行业，但Serverless的推广和生产落地的过程却不容乐观，Serverless理念与实操生产的过程中存在Gap，挑战着人们固有的使用体验和习惯。

阿里云坚信Serverless将作为云原生之后确定性的发展方向，相继推出了FC,SAE等多款云产品来覆盖不同领域，不同类型的应用负载来使用Serverless技术，并且不断在推进整个Serverless理念的普及与发展。

就当前Serverless整个市场格局而言，阿里云已经做到了Serverless产品能力中国第一，全球领先，在去年Forrester评测魔力象限中可以明显的看到阿里云在Serverless领域已经与AWS不相上下，于此同时，阿里云Serverless用户占比中国第一，在2020年中国云原生用户调研报告中整个阿里云Serverless用户占比已经达到了66%，而在Serverless技术采用情况的调研中表明，已经有越来越多的开发者和企业用户将Serverless技术应用于核心业务或者将要应用于核心业务之中。

Serverless弹性探索

弹性能力作为云的核心能力之一，所关注的问题是容量规划与实际集群负载间的矛盾，通过两幅图的对比可以看到，如果采用预先规划的方式进行资源安排，会由于资源准备量和资源需求量的不匹配导致资源浪费或者资源不足的情况，进而导致成本上的过多开销甚至业务受损，而我们期望极致弹性能力，是准备的资源和实际需求的资源几乎匹配，这样使得应用整体的资源利用率较高，成本也随业务的增减和相应的增减，同时不会出现因容量问题影响应用可用性的情况，这就是弹性的价值。

弹性其实现上分为可伸缩性和故障容忍性,可伸缩性意味着底层资源可以参照指标的变化有一定的自适应能力，而故障容忍性则是通过弹性自愈确保服务中的应用或实例处于健康的状态。上述能力带来的价值收益在于降成本的同时提升应用可用性，一方面，资源使用量贴合应用实际消耗量，另一方面，提升峰值的应用可用性，进而灵活适应市场的不断发展与变化。

下面将对当前较为普遍的三种弹性伸缩模式进行阐述和分析。

首先是IaaS弹性伸缩，其代表产品是各云厂商云服务器弹性伸缩，如阿里云ess,可以通过配置云监控的告警规则来触发相应的ECS增减操作，同时支持动态增减Slb后端服务器和Rds白名单来保证可用性，通过健康检查功能实现弹性自愈能力。 ESS定义了伸缩组的概念，即弹性伸缩的基本单位，为相同应用场景的ECS实例的集合及关联Slb,Rds,同时支持多种伸缩规则，如简单规则，进步规则，目标追踪规则，预测规则等，用户的使用流程为创建伸缩组和伸缩配置，创建伸缩规则，监控查看弹性执行情况。

Kubernetes弹性伸缩，这里主要关注于水平弹性hpa，其代表产品为K8s以及其所对应的托管云产品，如阿里云容器服务，K8s做为面向应用运维的基础设施和PlatformforPlatform,提供的内置能力主要是围绕着容器级别的管理和编排来展开的,而弹性能力聚焦于对底层Pod的动态水平伸缩，K8shpa通过轮询Pod的监控数据并将它与目标期望值比较进行，通过算法实时计算来产生期望的副本数，进而对Workload的副本数进行增减操作，用户在实际使用上需要创建并配置对应的指标源和弹性规则以及对应的Workload，可以通过事件来查看弹性的执行情况。

最后介绍一下应用画像弹性伸缩，其主要用于互联网公司内部，如阿里ASI容量平台。容量平台提供容量预测服务和容量变更决策服务，指导底层容量变更组件如AHPA/VPA实现容量弹性伸缩，并根据弹性结果修正容量画像。以画像驱动为主+指标驱动为辅实现弹性伸缩能力，通过提前伸缩+实时修正来降低弹性伸缩风险。整个弹性伸缩会借助odps和机器学习能力对实例监控等数据进行处理并产生应用画像，如基准画像，弹性画像，大促画像等，并借助容量平台来完成画像注入，变更管控和故障熔断等操作。用户使用流程为应用接入，基于历史数据/经验生成对应的容量画像，实时监控指标修正画像，并监控查看弹性执行情况。

从对比可以看出各产品弹性伸缩功能模式上从抽象来讲基本相同，均由触发源，弹性决策和触发动作组成，触发源一般依赖外部监控系统，对节点指标，应用指标进行采集处理，弹性决策一般基于周期性轮询并算法决策，有部分基于历史数据分析预测以及用户定义的定时策略，而触发动作为对实例进行水平扩缩，并提供变更记录与对外通知。各个产品在此基础上做场景丰富度，效率，稳定性的竞争力，并通过可观测能力提升弹性系统的透明度，便于问题排查和指导弹性优化，同时提升用户使用体验与粘性。

各产品弹性伸缩模型也存在这一定的差异，对于IaaS弹性伸缩，其作为老牌弹性伸缩能力，沉淀时间长，功能强大且丰富，云厂商间能力趋于同质化。弹性效率相较容器受限，且强绑定各自底层Iaas资源。 Kubernetes作为开源产品，通过社区力量不断优化迭代弹性能力和最佳实践，更符合绝大部分开发运维人员诉求。对弹性行为和api进行高度抽象，但其可扩展性不强，无法支持自定义需求。而应用画像弹性伸缩具有集团内部特色，根据集团应用现状和弹性诉求进行设计，且更聚焦于资源池预算成本优化，缩容风险，复杂度等痛点。不易拷贝扩展，特别对于外部中小客户不适用。

从终态目标上，可以看出公有云与互联网企业方向的不同：

互联网企业往往由于其内部应用具有显著流量特征，应用启动依赖多，速度慢，且对整体资源池容量水位，库存财务管理，离在线混部有组织上的诸多诉求，因而更多的是以容量画像提前弹性扩容为主，基于Metrics计算的容量数据作为实时修正，其目标是容量画像足够精准以至于资源利用率达到预期目标。

公有云厂商服务于外部客户，提供更为通用，普适的能力，并通过可拓展性满足不同用户的差异化需求。尤其在Serverless场景，更强调应用应对突发流量的能力，其目标在于无需容量规划，通过指标监控配合极致弹性能力实现应用资源的近乎按需使用且整个过程服务可用。

Serverless弹性落地

Serverless作为云计算的最佳实践、云原生发展的方向和未来演进趋势，其核心价值在于快速交付、智能弹性、更低成本。

在时代背景下，SAE应运而生，SAE是一款面向应用的ServerlessPaaS平台，支持SpringCloud、Dubbo等主流开发框架，用户可以零代码改造直接将应用部署到SAE，并且按需使用，按量计费，可以充分发挥Serverless的优势为客户节省闲置资源成本，同时体验上采用全托管，免运维的方式，用户只需聚焦于核心业务开发，而应用生命周期管理，微服务管理，日志，监控等功能交由SAE完成。

弹性的竞争力主要在于场景丰富度，效率，稳定性的竞争力，先讲一下SAE在弹性效率上的优化。

通过对SAE应用的整个生命周期进行数据统计和可视化分析，其包含调度，initcontainer创建，拉取用户镜像，创建用户容器，启动用户容器&应用这几个阶段，示意图中对其耗时的占比进行了简化。我们可以看到整个应用生命周期耗时集中于调度，拉取用户镜像，应用冷启动这几个阶段。针对于调度阶段，其耗时主要在于SAE当前会执行打通用户VPC操作，由于该步骤强耦合于调度，本身耗时较长，且存在创建长尾超时，失败重试等情况，导致调度链路整体耗时较长。

由此产生的疑问是可否优化调度速度？可否跳过调度阶段?而对于拉取用户镜像，其包含拉取镜像与解压镜像的时长，特别是在大容量镜像部署的情况下尤为突出。优化的思路在于拉取镜像是否可以优化使用缓存，解压镜像是否可以优化。而对于应用冷启动，SAE存在大量单体和微服务的JAVA应用，JAVA类型应用往往启动依赖多，加载配置慢，初始化过程长，导致冷启动速往往达到分钟级。优化的方向在于可否避免冷启动流程并使用户尽量无感，应用无改造。

首先SAE采用了原地升级能力，SAE起初使用了K8s原生的Deployment滚动升级策略进行发布流程，会先创建新版本Pod，再销毁旧版本Pod进行升级，而所谓原地升级，即只更新Pod中某一个或多个容器版本、而不影响整个Pod对象、其余容器的升级。其原理是通过K8spatch能力，实现原地升级Container，通过K8sreadinessGates能力，实现升级过程中流量无损。

原地升级给SAE带来了诸多价值，其中最重要的是避免重调度，避免Sidecar容器（ARMS,SLS,AHAS）重建,使得整个部署耗时从消耗整个Pod生命周期到只需要拉取和创建业务容器，于此同时因为无需调度，可以预先在Node上缓存新镜像，提高弹性效率。 SAE采用阿里开源Openkruise项目提供的Cloneset作为新的应用负载，借助其提供的原地升级能力，使得整个弹性效率提升42%。

同时SAE采用了镜像预热能力，其包含两种预热形式：调度前预热，SAE会对通用的基础镜像进行全节点缓存，以避免其频繁的从远端进行拉取。与此同时对于分批的场景支持调度中预热，借助Cloneset原地升级能力，在升级的过程中可以感知到实例的节点分布情况，这样就可以在第一批部署新版本镜像的同时，对后面批次的实例所在节点进行镜像预拉取，进而实现调度与拉取用户镜像并行。通过这项技术，SAE弹性效率提升了30%。

刚才讲述的优化点在于拉取镜像部分，而对于解压镜像，传统容器运行需要将全量镜像数据下载后再解包，然而容器启动可能仅使用其中部分的内容，导致容器启动耗时长。 SAE通过镜像加速技术，将原有标准镜像格式自动转化为支持随机读取的加速镜像，可以实现镜像数据免全量下载和在线解压，大幅提升应用分发效率，同时利用Acree提供的P2P分发能力也可以有效减少镜像分发的时间。

对于Java应用冷启动较慢的痛点，SAE联合Dragonwell11提供了增强的AppCDS启动加速策略，AppCDS即ApplicationClassDataSharing，通过这项技术可以获取应用启动时的Classlist并Dump其中的共享的类文件，当应用再次启动时可以使用共享文件来启动应用，进而有效减少冷启动耗时。映射到SAE的部署场景，应用启动后会生成对应的缓存文件在共享的NAS中，而在进行下一次发布的过程中就可以使用缓存文件进行启动。整体冷启动效率提升45%。

除了对整个应用生命周期的效率进行优化外，SAE也对弹性伸缩进行了优化，整个弹性伸缩流程包括弹性指标获取，指标决策以及执行弹性扩缩操作三部分。对于弹性指标获取，基础监控指标数据已经达到了秒级获取，而对于七层的应用监控指标，SAE正在规划采用流量透明拦截的方案保证指标获取的实时性。而弹性决策阶段，弹性组件启用了多队列并发进行Reconcile，并实时监控队列堆积，延时情况。

SAE弹性伸缩包括强大的指标矩阵，丰富的策略配置，完善的通知告警机制及全方位可观测能力,支持多种数据源：原生的MetricsServer，MetricsAdapter，Prometheus，云产品SLS,CMS,SLB以及外部的网关路由等，支持多种指标类型：CPU、MEM、QPS、RT、TCP连接数，出入字节数，磁盘使用率，Java线程数，GC数还有自定义指标。对指标的抓取和预处理后，可以自定义配置弹性策略来适配应用的具体场景：快扩快缩，快扩慢缩，只扩不缩，只缩不扩，DRYRUN，自适应扩缩等。

同时可以进行更为精细化的弹性参数配置,如实例上下限，指标区间，步长比例范围，冷却、预热时间，指标采集周期和聚和逻辑，CORN表达式，后续也会支持事件驱动的能力。弹性触发后会进行对应的扩缩容操作，并通过切流保证流量无损，并且可以借助完善的通知告警能力（钉钉，webhook,电话，邮件，短信）来实时触达告知用户。弹性伸缩提供了全方位的可观测能力，对弹性的决策时间，决策上下文进行清晰化展现，并且做到实例状态可回溯，实例SLA可监控。

SAE弹性能力在场景丰富度上也有着相应的竞争力，这里重点介绍一下SAE当前支持的四种场景：

定时弹性：在已知应用流量负载周期的情况下进行配置，应用实例数可以按照时间，星期，日期周期进行规律化扩缩，如在早8点到晚8点的时间段保持10个实例数应对白天流量，而在其余时间由于流量较低则维持在2个实例数甚至缩0。适用于资源使用率有周期性规律的应用场景，多用于证券、医疗、政府和教育等行业。

指标弹性：可以配置期望的监控指标规则，SAE会时应用的指标稳定在所配置的指标规则内，并且默认采用快扩慢缩的模式来保证稳定性。如将应用的cpu指标目标值设置为60%，QPS设置为1000，实例数范围为2-50。这种适用于突发流量和典型周期性流量的应用场景，多用于互联网、游戏和社交平台等行业。

混合弹性：将定时弹性与指标弹性相结合，可以配置不同时间，星期，日期下的指标规则，进而更加灵活的应对复杂场景的需求。如早8点到晚8点的时间段CPU指标目标值设置为60%，实例数范围为10-50，而其余时间则将实例数范围降为2-5，适用于兼备资源使用率有周期性规律和有突发流量、典型周期性流量的应用场景，多用于互联网、教育和餐饮等行业。

自适应弹性：SAE针对流量突增场景进行了优化，借助流量激增窗口，计算当前指标在这个时刻上是否出现了流量激增问题，并会根据流量激增的强烈程度在计算扩容所需的实例时会增加一部分的冗余，并且在激增模式下，不允许缩容。

稳定性是SAE弹性能力建设的过程中非常重要的一环，保证用户应用在弹性过程中按照预期行为进行扩缩，并保证整个过程的可用性是关注的重点。 SAE弹性伸缩整体遵循快扩慢缩的原则，通过多级平滑防抖保证执行稳定性，同时对于指标激增场景，借助自适应能力提前扩容。 SAE当前支持四级弹性平滑配置保证稳定性：

一级平滑：对指标获取周期，单次指标获取的时间窗口，指标计算聚和逻辑进行配置

二级平滑：对指标数值容忍度，区间弹性进行配置

三级平滑：对单位时间扩缩步长，百分比，上下限进行配置

四级平滑：对扩缩冷却窗口，实例预热时间进行配置

Serverless弹性最佳实践

SAE弹性伸缩可以有效解决瞬时流量波峰到来时应用自动扩容，波峰结束后自动缩容。高可靠性、免运维、低成本的保障应用平稳运行，在使用的过程中建议遵循以下最佳实践进行弹性配置。

配置健康检查和生命周期管理

建议对应用健康检查进行配置，以保证弹性扩缩过程中的应用整体可用性，确保您的应用仅在启动、运行并且准备好接受流量时才接收流量同时建议配置生命周期管理Prestop，以确保缩容时按照预期优雅下线您的应用。

采用指数重试机制

为避免因弹性不及时，应用启动不及时或者应用没有优雅上下线导致的服务调用异常，建议调用方采用指数重试机制进行服务调用。

应用启动速度优化

为提升弹性效率，建议您优化应用的创建速度，可以从以下方面考虑优化：

软件包优化：优化应用启动时间，减少因类加载、缓存等外部依赖导致的应用启动过长

镜像优化：精简镜像大小，减少创建实例时镜像拉取耗时，可借助开源工具Dive，分析镜像层信息，有针对性的精简变更

Java应用启动优化：借助SAE联合Dragonwell11，为Java11用户提供了应用启动加速功能

弹性伸缩指标配置

弹性伸缩指标配置，SAE支持基础监控，应用监控多指标组合配置，您可以根据当前应用的属性（CPU敏感/内存敏感/io敏感）进行灵活选择。

可以通过对基础监控和应用监控对应指标历史数据（如过去6h,12h,1天,7天峰值，P99,P95数值）进行查看并预估指标目标值，可借助PTS等压测工具进行压测，了解应用可以应对的并发请求数量、需要的CPU和内存数量，以及高负载状态下的应用响应方式，以评估应用容量峰值大小。

指标目标值需要权衡可用性与成本进行策略选择，如

可用性优化策略配置指标值为40%

可用性成本平衡策略配置指标值为50%

成本优化策略配置指标值为70%

同时弹性配置应考虑梳理上下游，中间件，db等相关依赖，配置对应的弹性规则或者限流降级手段，确保扩容时全链路可以保证可用性。

在配置弹性规则后，通过不断监视和调整弹性规则以使容量更加接近应用实际负载。

内存指标配置

关于内存指标，考虑部分应用类型采用动态内存管理进行内存分配（如Javajvm内存管理，GlibcMalloc和Free操作），应用闲置内存并没有及时释放给操作系统，实例消耗的物理内存并不会及时减少且新增实例并不能减少平均内存消耗，进而无法触发缩容，针对于该类应用不建议采用内存指标。

Java应用运行时优化：释放物理内存，增强内存指标与业务关联性

借助Dragonwell运行时环境，通过增加JVM参数开启ElasticHeap能力，支持Java堆内存的动态弹性伸缩，节约Java进程实际使用的物理内存占用。

最小实例数配置

配置弹性伸缩最小实例数建议大于等于2，且配置多可用区VSwitch，防止因底层节点异常导致实例驱逐或可用区无可用实例时应用停止工作，保证应用整体高可用。

最大实例数配置

配置弹性伸缩最大实例数时，应考虑可用区IP数是否充足，防止无法新增实例。可以在控制台VSwitch处查看当前应用可用IP，若可用IP较少考虑替换或新增VSwitch。

弹性到达最大值

可以通过应用概览查看当前开启弹性伸缩配置的应用，并及时发现当前实例数已经到达峰值的应用，进行重新评估其弹性伸缩最大值配置是否合理。若期望最大实例数超过产品限制（当前限制单应用50实例数，可提工单反馈提高上限）

可用区再均衡

弹性伸缩触发缩容后可能会导致可用区分配不均，可以在实例列表中查看实例所属可用区，若可用区不均衡可以通过重启应用操作实现再均衡。

自动恢复弹性配置

当进行应用部署等变更单操作时，SAE会停止当前应用的弹性伸缩配置避免两种操作冲突，若期望变更单完成后恢复弹性配置，可以在部署时勾选系统自动恢复。

弹性历史记录

SAE弹性生效行为当前可通过事件进行查看扩缩时间，扩缩动作，以及实时，历史决策记录和决策上下文可视化功能，以便衡量弹性伸缩策略的有效性，并在必要时进行调整。

弹性事件通知

结合钉钉，Webhook,短信电话等多种通知渠道，便于及时了解弹性触发状况。

最后分享一个采用SAE弹性伸缩功能的客户案例，在2020新冠疫情期间，某在线教育客户业务流量暴涨7-8倍，硬件成本和业务稳定性面临巨大风险。如果此时采用传统的ECS架构，客户就需要在非常短的时间内做基础设施的架构升级，这对用户的成本及精力都是非常大的挑战。但如果采用SAE，用户0改造成本即可享受Serverless带来的技术红利，结合SAE的多场景弹性策略配置，弹性自适应和实时可观测能力，保障了用户应用在高峰期的业务SLA，并且通过极致弹性效率，节省硬件成本达到35%。

综上，弹性发展方向上，尤其是在Serverless场景，更强调应对突发流量的能力，其目标在于无需容量规划，通过指标监控配合极致弹性能力实现应用资源的近乎按需使用且整个过程服务可用。 SAE通过对弹性组件和应用全生命周期的不断优化以达到秒级弹性，并在弹性能力，场景丰富度，稳定性上具备核心竞争力，是传统应用0改造上Serverless的最佳选择。

标签：游戏推广的可靠性指南规避风险和优化结果衡量有效性

本文地址： https://xintukeji.cn/xintu/169620.html