现在是你帮助确定2021年超级用户奖得主的时候了——年度超级用户奖是为了表彰那些在为社区做出贡献的同时使用开放式基础设施改进业务的组织。

今年,超级用户奖得主将于11月17日至18日在 Live:上宣布,这将是全球相关人士齐聚一堂,了解的最佳机会。

彭博社云团队是11位超级用户奖提名者之一。看看为什么该团队获得提名?

开放式基础设施如何改变了业务?

彭博社基于的私有云(称为 Cloud ,或BCC)已成为彭博社数据中心最大的计算平台。大多数工程团队至少部分采用了虚拟机,从而提高了利用率、稳定性和操作灵活性。

BCC向彭博社6500多名软件工程师社区提供开放式基础设施即服务(IaaS)。作为第一款产品,它支持自动化的端到端流程,使应用程序团队能够在不需要人工干预或发出通知单的情况下配置、自动构建和联机机器。这帮助在数据中心实现了更高的机器利用率(4倍或更多)。

该组织是如何参与或贡献开源项目的?

BCC是一个在上管理的开源项目。该团队还直接或通过支持供应商为(Nova和)和项目提供修复。

迄今为止,彭博社已经举办了三次 会议。其中两次会议在彭博社纽约和伦敦办事处举行。该团队还参与了在墨西哥、德国、意大利、日本等地组织的许多其他会议。

该团队的一些重要上游贡献包括:AZ anti- 。错误修复包括关于的两次。

在其开放基础设施环境中使用了哪些开源技术?

、Ceph、、MySQL、、、、、、bird2、 httpd等。

开放式基础架构环境的规模有多大?

在分布在4个站点的现代集群中,该团队在超过数千台主机(每个主机通常具有1.5 TB以上的RAM)部署了约120k物理(/Ceph //)核心(并在不断增长)。每个都有多PB的NVME支持的Ceph存储。

一些资源仍然部署在传统 /nova-/Ceph 集群中(20k内核和)。

在使用开放式基础设施的过程中,克服了哪些挑战?

旧集群被困在nova-上,升级路径很少。

新集群于2018年末开始使用 Rocky/,最近零停机时间升级为 。托管的Ceph集群最近已从Ceph Mimic升级为(也没有停机时间)。这些新的/Ceph集群已经提供了几年的连续服务。

由于使用了L2 技术、标记VLAN和其他受限的架构选择,较旧的架构无法扩展到200个计算节点之外。我们的新架构是纯Layer 3,可以轻松支持4倍或更大的规模(目前有800个计算节点,并且增长迅速)。例如,在这些集群中,该团队在三个周末迁移了20000个虚拟机进行维护。

如何利用开放式基础设施进行创新?

BCC已经证明了在彭博大型数据中心计算中的价值。它满足了对性能、稳定性和可用性的严格要求,取代了特定任务的离散服务器,在某些情况下还取代了专有的虚拟化解决方案。

该团队还证明了Ceph在混合软件定义存储中的使用,能够摆脱传统企业存储供应商的产品。

该团队使用作为实现,能够在一个高度可扩展的L3完全路由IP结构上实现分布式可扩展防火墙,而无需整个SDN的开销和复杂性——没有网络虚拟化、没有VLAN、VXLAN、无需encap/decap/。这有助于满足实时流量监控、威胁检测、合规性等需求。

原文链接: