关键数据
- 5倍执行速度提升
- 60 秒停机时间,从 5 分钟缩短
从遗留数据库基础设施迁移是一项巨大的技术壮举,尤其是当涉及数百项服务、数 TB 数据和 99.99% 的正常运行时间时。在 Plaid,Deno 驱动的自动化帮助将切换时间从数周缩短到数天,以行业领先的速度加速了这项关键任务的过渡。
挑战
Plaid 是一个世界级的金融服务平台,提供 API 为全球数千家金融科技公司提供支持。2023 年初,他们启动了一项公司范围内的努力,以实现其主要关系数据平台的现代化。随着 AWS Aurora MySQL 接近生命周期结束并显示出在可伸缩性、可靠性和开发人员速度方面的明显限制,存储团队面临着迁移数十项关键服务的艰巨任务——每项服务都具有高正常运行时间要求和复杂的数据足迹。他们需要一个能够随着 Plaid 增长而扩展,同时避免遗留系统带来的运营拖累的未来之路。
尽管 Plaid 选择了 TiDB 作为其下一个数据库平台,但迁移本身就提出了巨大的工程挑战:需要迁移 100 项服务,处理每秒 40 万次查询和数十 TB 数据,同时还要保持严格的 SLA,而执行团队却很小。为了成功,团队需要一个安全、可审计、快速且可重复的迁移过程。Deno 正是在此时发挥了作用。
解决方案
Plaid 存储团队的基础设施迁移需要一个符合其高信任度、高效率工作的解决方案。他们选择 Deno 作为自动化框架的基础,因为它具备以下特点:
- 内置 TypeScript 支持
- 零配置依赖管理
- 严格的安全模型
- 强大的开发人员体验
- 强大且精简的 shell 执行库:dax
存储团队使用 Deno 来支持动态运行手册,这些可执行的笔记本结合了 TypeScript 代码、操作文档和 CLI 界面:所有这些都嵌入在 Jupyter 中。这种方法将重复、易错的迁移转变为简化、可审计的工作流程,工程师可以放心地运行。
[Deno] 使我们能够以更快的速度转换服务,同时不牺牲可靠性。与业内同行交流后,我们发现我们正在以行业领先的速度,安全地将我们的服务群迁移到 TiDB。
— Zander Hill,架构负责人
通过将迁移逻辑集中到 Deno 驱动的笔记本中,存储团队能够在两年内安全地迁移 100 项服务,同时将每项服务的切换时间从 3-4 周缩短到一周,并将切换停机时间从 5 分钟缩短到 60 秒以内。此次迁移是团队技术领导力和协调能力的证明,Deno 帮助他们实现了行业领先的、自动化优先的迁移模式。