Datadog > 实例探究 > 丰田通过使用 Datadog 监控 AWS 实现更快、更安全的大规模部署

丰田通过使用 Datadog 监控 AWS 实现更快、更安全的大规模部署

Datadog Logo
公司规模
1,000+
地区
  • America
国家
  • United States
产品
  • Datadog
  • Chofer
  • Amazon EC2
  • Amazon RDS
  • Amazon EKS
技术栈
  • AWS
  • Backstage
实施规模
  • Enterprise-wide Deployment
影响指标
  • Cost Savings
  • Digital Expertise
  • Productivity Improvements
技术
  • 分析与建模 - 实时分析
  • 基础设施即服务 (IaaS) - 云计算
  • 平台即服务 (PaaS) - 应用开发平台
适用行业
  • 汽车
适用功能
  • 离散制造
  • 产品研发
服务
  • 云规划/设计/实施服务
  • 数据科学服务
关于客户
65 多年来,丰田 (NYSE:TM) 一直是美国文化结构的一部分,并致力于通过其丰田和雷克萨斯品牌以及近 1,500 家经销商推动可持续的下一代移动出行。丰田汽车北美公司 (TMNA) 是丰田汽车公司在美国、加拿大、墨西哥和波多黎各的运营子公司。TMNA 致力于打造高品质汽车,并寻找创新方法利用尖端汽车技术推动社会发展。TMNA 于 2015 年开始使用亚马逊网络服务 (AWS)。在此过程中,它还希望简化和标准化云中的应用程序开发并缩短上市时间。为此,工程总监 Kishore Jonnalagedda 带领 TMNA 云平台团队使用在 AWS 上运行的 Backstage 构建了一个名为 Chofer 的内部自助式开发平台。
挑战
丰田汽车北美公司 (TMNA) 于 2015 年开始使用 Amazon Web Services (AWS) 来简化和标准化云中的应用程序开发并缩短上市时间。但是,该团队缺乏一致的监控工具,这带来了可靠性问题。一些开发人员使用开源工具,另一些开发人员使用日志管理工具,而有些开发人员什么都没用。因此,团队成员经常花费数小时试图找出中断的根本原因,因为他们不知道要查找什么或在哪里查找。由于总共有 1,600 个应用程序(300 个在云中)和 100 多个团队,这是一项艰巨的任务。除了获得统一的可见性之外,云平台团队还寻求缩短平均检测时间 (MTTD),并确保他们可以满足 99.9% 正常运行时间的 SLA,同时降低成本并帮助工程师提高效率。
解决方案
Jonnalagedda 和他的团队开始寻找一种可观察性解决方案,该解决方案可以在单一视图中一目了然地全面了解 TMNA 环境每一层的运行状况和性能。最终,TMNA 通过将其 AWS 服务中的数据导入 Datadog 实现了这一目标。它现在可以在一个地方查看在 Amazon EC2、Amazon RDS、Amazon EKS 和其他服务上运行的云托管应用程序。丰田还需要监控其技术堆栈的不同部分。Datadog 通过与 600 多个关键技术的集成为丰田提供了所需的可视性,包括对 100 多种 AWS 服务的支持和开箱即用的仪表板。Datadog 的仪表板帮助 TMNA 以更高的透明度开发应用程序,将指标和日志集中到一个地方(无论其来源如何),并帮助团队快速了解背景信息并更快地解决问题。这些可视化也是组织查看站点可靠性工程实践、可视化服务级别目标 (SLO) 和管理 AWS 过剩容量的简单方法。
运营影响
  • TMNA has saved $10 million over two years using Chofer. Part of that savings can be attributed to using Datadog to monitor its underlying infrastructure, supporting services, applications, and security data in a single observability platform.
  • With these time savings, teams now ship projects in weeks instead of quarterly.
  • In addition, since new hires can easily make sense of TMNA’s distributed architecture with Datadog’s centralized platform, onboarding developers and contractors now takes as little as three to four days instead of the eight to twelve weeks previously required.
  • Finally, Datadog helps Jonnalagedda’s team reduce MTTD. “MTTD is reduced from about six hours to 15 minutes in a large-scale system,” says Jonnalagedda.
  • In another example, TMNA also used Datadog’s services to help reduce the mean time to resolution (MTTR) from seven days to two hours in one of its manufacturing plants, avoiding hundreds of thousands of dollars of cost from downtime.
数量效益
  • MTTD reduced by 96% from about 6 hours to 15 minutes on average
  • New developers and contractors onboard 20X faster in 3–4 days instead of 8–12 weeks
  • Teams now ship projects in weeks instead of quarterly

Case Study missing?

Start adding your own!

Register with your work email and create a new case study profile for your business.

Add New Record

相关案例.

联系我们

欢迎与我们交流!
* Required
* Required
* Required
* Invalid email address
提交此表单,即表示您同意 IoT ONE 可以与您联系并分享洞察和营销信息。
不,谢谢,我不想收到来自 IoT ONE 的任何营销电子邮件。
提交

感谢您的信息!
我们会很快与你取得联系。