正当很多知名网站都在抱怨自己受到了AWS 问题的影响时, Twilio 的API 和服务并未受一定的影响,尽管他们也严重依赖于AWS 来培育并扩展自己的云电话平台(cloud telephony platform)。对于Evan Cooke(Twilio的合伙创始人与 CTO)而言,这不仅展现了云服务在开启当代互联网生态环境方面的惊人成功,还展现了坚实可靠的分布式架构设计在构建云服务时的重要性。
当我们在 Amazon Web Services 上培育并扩展 Twilio 的时候,我们遵循了一系列的架构设计原则,以便能将底层基础设施中偶发但不可避免的问题所带来的影响降到最小。
构建由单台主机构成的简单服务,而非多依赖的主机构成的服务,可以创建复制服务实例来抵御主机故障。
发生故障时,让软件快速识别失败并重试请求。每个服务都运行多个冗余拷贝,短时间内超时,然后绕过失败或不可访问的服务进行重试。
如果所依赖服务的 API 是幂等的,那就从另一方面代表着可以安全地对失败请求进行重试。
将业务逻辑分散到小的无状态服务中,这些服务可以被放到简单的同构服务池中。
根据故障的详细说明,Evan 还解释了为什么Twilio 只针对非关键和非延时敏感的任务使用EBS,因为这不需要符合“故障单元是单台主机”原则。如果EBS 遇到了问题,所有依赖它的服务都可能会发生故障。他们转而关注于利于EC2 主机上的临时磁盘来做持久化。如果临时磁盘坏了,那么故障的范围仅仅是那台主机。Evan 将发表一篇后续文章来描述他们是如何跨过多个临时磁盘来做RAID0 以提升I/O 性能的。
Amazon 拥有为数众多的服务,那些费时费力的任务都可以被简化并自动化进一次简单的调用中,开发者仅需一次调用就可以了。Cloudwatch(监控与自动扩展)和RDS(数据库管理)就是这里面的两个。当你开始使用这一些服务后,你就已经置身于一个 PaaS 场景中了,你使用了某个厂商所独有服务。
对他而言,此类依赖和有几率发生的故障都应该被纳入架构和业务模型之中,因为要构建一个云提供商未知的架构,如果不自己重新构建这些服务,几乎就是不现实的。
很明显,就算在云端,灾难恢复计划也是必须的,架构无论现在还是以后,都会是构建基于云的解决方案的必备内容,这并不是什么新鲜观点。Twilio 的原则是否足够?从中你是如何理解云架构的演进的?更多的冗余?自己开发服务?更多的架构原则?这将如何转变为基于PaaS 的解决方案?
通过提供一套无与伦比的服务,Amazon在持续定义云。而Peter Wayner认为,AWS正在蚕食互联网。
虽然AWS将Physalia开源的可能性很小,但它有可能鼓励其他人以开源的方式重新创建其架构元素,就像过去许多超大规模的云计算科技公司所做的那样。
在microXchg 2016大会的一场演讲中,来自Zalando的演讲者为听众介绍了他们推出的一个适用于多个自治团队,并具备审计合规性的平台即服务(PaaS)产品,该产品是在Amazon Web Services(AWS)的基础上运行的。演讲的关键内容有:随着一个工程性组织的发展,为了使开发工作做到同步扩张,重点是实现具备自治能力的团队,并打造一个支持性的技术平台(PaaS),以及审计和一个清晰的愿景。
Amazon MSK的目标是使基于Kafka的流应用程序的构建和运行变得更容易。
2011年4月21日至22日是值得云计算从业者纪念的日子。Amazon的IaaS服务发生故障,导致许多商业网站的服务中断,影响很严重。作为云计算用户,我们应该思考的是,如何保证即便在云服务不可用的情况,我们的应用架构仍然能够屹立不倒?本文正是站在云计算用户的角度试图探讨这一问题。
上周,又一AWS服务的失效冲击了几大网站及其服务。怎么样才可以避免瘫痪?仅为伸缩进行架构还不够,还需为灾备进行架构。
一旦你的团队决定做多机房部署,那么同城双活已经能够很好的满足你的需求了,这个方案相比异地多活要简单很多。
Auth0是一家认证、授权和SSO服务提供商。近期,Auth0完成将自身架构从三家云提供商(即AWS、Azure和Google Cloud)转向AWS一家,这是因为它的服务越来越依赖于AWS服务。现在,Auth0的系统分布在4个AWS域中,其中服务是跨区复制的。
最近,Amazon Web Services(AWS)团队在Elastic Beanstalk服务中加入了对Node.js的支持,使它所支持的平台的集合处于行业领头羊。AWS加入了“青睐Node.js的云服务”这个竞争非常激烈的领域,并将尝试通过整合其他顶级AWS服务来让自己与众不同。
公有云领域的竞争在加剧,数据监管和业务需求催生了混合云的崛起。在这篇文章里,来自Adobe的Nicolas Brousse解释了成功构建私有云的五个关键因素。
这一讲,我们来尝试一下,看能否通过一些简单的梳理,建立对高可用设计的完整认知。
Slack与AWS签订了一份价值2.5亿美元的五年期合同,这是近期继Pinterest、Lyft之后的第三家在招股文件中透露与AWS签订长期协议的公司。
我在以前的博文 (AWS – Ready to Weather the Storm) 中说过,我们采取了多方面的预防的方法,以帮助确保 AWS 在面对飓风、风暴以及其他自然灾害时保持正常运行。
本迷你书包括 86 个业务开发中常见踩坑点。每一个知识点都相当的实用,是程序员业务开发中的必备避坑指南...