地区
- America
国家
- United States
产品
- Geodesic
- Blackhole
技术栈
- Pachyderm
- Apache Airflow
- Databricks
实施规模
- Enterprise-wide Deployment
影响指标
- Productivity Improvements
- Innovation Output
技术
- 平台即服务 (PaaS) - 数据管理平台
- 分析与建模 - 大数据分析
- 分析与建模 - 机器学习
服务
- 数据科学服务
- 云规划/设计/实施服务
关于客户
SeerAI 是一家将人工智能和机器学习应用于时空数据的公司,旨在让客户获得洞察力和竞争优势。该公司的旗舰产品 Geodesic 是世界上第一个去中心化平台,经过优化,可从行星级时空数据中获取洞察力和分析能力。该公司总部位于纽约州新罗谢尔。SeerAI 旨在不断发展知识和数据关系,以便最终能够回答几乎所有问题。该公司处理范围广泛的数据集,具有复杂的相互关系和庞大的规模。
挑战
SeerAI 的旗舰产品 Geodesic 是世界上第一个经过优化的去中心化平台,可从行星级时空数据中获取见解和分析。处理时空数据是一项挑战。由于它涉及全球性问题,因此数据集规模庞大——通常需要数 PB 的图像。数据本身可能来自不同的来源,需要能够从去中心化数据模型加载和管理。最后,这些数据通常是异构的和非结构化的,因此非常复杂且难以处理。SeerAI 设计 Geodesic 是为了不断发展知识和数据关系,以便它最终可以回答几乎所有问题。在这种规模下,控制数据摄取、ML 作业调度、模型交互和数据版本控制可能极其复杂。
解决方案
SeerAI 选择 Pachyderm 作为大规模全球数据融合的核心组件。Pachyderm 是云原生且高度可扩展的,这使得 SeerAI 能够轻松为其数据科学工作流创建和使用多个管道和存储库。此外,Pachyderm 还会自动处理触发转换、数据共享、数据版本控制、并行性和资源管理,从而更高效地交付数据。Pachyderm 提供自动增量处理的能力通过仅处理差异并自动跳过重复数据来节省计算量。由于管道和数据都由 Pachyderm 管理,因此它可以通过并行处理自动扩展而无需编写任何代码。Pachyderm 与 Geodesic 中的核心微服务配合使用,以进行异构数据搜索和准备。该团队在 Blackhole 中使用 Pachyderm 来处理处理和格式化,以便可以轻松查询数据。Pachyderm 还使团队能够更好地控制机器学习作业管理。
运营影响
数量效益
Case Study missing?
Start adding your own!
Register with your work email and create a new case study profile for your business.