播客 > Use Cases > Ep. 33a: Stability of an oil refinery = S&P 500 index — An Interview with Drew Conway of Alluvium -
Download MP3
Ep. 33a: Stability of an oil refinery = S&P 500 index — An Interview with Drew Conway of Alluvium
,
Wednesday, May 23, 2018

稳定性与标准普尔 500 指数有何相似之处?我们如何使用数据来识别火灾风险以及在纽约市哪里最好开一家咖啡店?

从使用回归来识别纽约市的火灾风险到管理复杂的过程控制,这一切都归结为在正确的时间将正确的信息提供给正确的人以做出决定。 Drew 解释了稳定性意味着什么,以及机器和人之间在数据方面的紧张关系。

音频文字.

欢迎来到工业物联网聚焦,工业物联网思想领袖与您的主持人 Erik Walenza 一起正在改变企业,这是您获得洞察力的第一站。

Erik:欢迎回到工业物联网的聚光灯下。这是我们与 Drew Conway 的三部分讨论的第一集。 Drew 是 Alluvium 的创始人兼首席执行官。他也是一个非常活跃的人,参与了许多其他公司。因此,我们将更详细地讨论其中的一些。我们将首先重点介绍 Drew 的背景,以及他参与的其他一些项目,然后从商业角度更深入地了解 Alluvium。

对于播客的第二部分,我们将更深入地探讨技术,包括 Alluvium 的技术,以及更普遍的技术。因此,看看他们如何与市场上的其他公司区分开来。然后我们将在第三部分结束对具体案例研究的深入探讨。德鲁,非常感谢您今天抽出时间与我们交谈。

德鲁:埃里克,很高兴来到这里。感谢您的款待。

Erik:所以在我们进入 Alluvium 之前,带我们走一遍,也许我们可以回到你为纽约市市长办公室提供数据分析建议的时候。你是怎么进入这个角色的?那么这实际上需要与市政府合作吗?

德鲁:所以,也许只是在此之前稍微了解一下它的背景。当我来到纽约市时,我是一名研究生。我在纽约大学攻读博士学位。当我到达那里时,只是运气好,并且强迫遗嘱设法与纽约一群非常有趣和雄心勃勃的人会面并互动,他们正在从事早期的数据科学工作。我的意思是,数据科学作为一门学科仍然相对较新。但可以肯定的是,在 2000 年代初到中期,我会说这是一门实践中的新生学科,人们仍在试图弄清楚它是什么。

我真正感兴趣并最终能够组织起来的一件事是,我们如何让数据科学界的人们与社会和公共部门互动?所以我实际上成立了一个名为 Data Kind 的组织,但在此过程中遇到了一群非常有趣的人,他们在社会和公共部门广泛开展工作。我实际上在纽约举办了一个名为 Data Gotham 的活动,我们真的想展示纽约市人们围绕数据所做的所有有趣工作。我真的很想找到纽约市政府的人,他可以来谈谈纽约市在他们的数据方面实际上做了什么。

于是我遇到了一位名叫迈克·弗劳尔斯的绅士。 Mike Flowers 是纽约市的第一位首席数据官。他实际上在纽约市建立了市长数据分析办公室。实际上,我最初是通过组织第一次 Data Gotham 会议认识他的,Mike 是我们的主旨发言人之一。他和我设法继续保持良好的关系。因为我对他所做的工作特别感兴趣,所以最终他问我是否愿意来帮助他和他的团队思考他们正在做的一些更深入的技术工作,我很高兴去做吧。所以在 2012 年 2013 年左右,我开始做志愿者,每周花几个小时和团队一起检查一些工作,然后有机会参与那里的一些非常有趣的项目。

Erik:那么他们在 2012-13 年做了哪些类型的项目?

德鲁:其中一个我真的没有参与太多的项目,但真正让他们脱颖而出的是他们与纽约消防部门合作的一个项目。所以这里有趣的故事是,纽约市和所有大城市一样,在建筑检查方面存在资源分配问题。因此,纽约的消防部门负责四处走动,寻找可能存在于不同建筑物中的任何安全或消防法规违规行为。

通常这样做的方式是你会得到一份你要去看的建筑物的清单。这份清单会发给各个消防站和分区,然后他们的检查员会出去,他们会去看看是否有任何事情需要修复。然后,如果他们发现了什么,他们会发布一份文件,说明这些事情需要修复。不幸的是,它往往效率低下。所以这些文件进来了,或者这些检查请求进来了,它们没有以任何特定的方式排序。所以检查员会出去,他们在哪里发现问题的命中率通常很低。

因此,迈克·弗劳尔斯和他的团队在发生了一起特别悲惨的事件后,消防员在一栋违反安全法规的建筑物中发生火灾,一些消防员受伤,一些人丧生,他们说,这需要改变。我们需要确切地知道这些建筑物中发生了什么。我们需要更好地找到这些违规行为的位置。

所以迈克和他的团队所做的就是说,纽约市实际上对他们的建筑物中发生的事情了如指掌,并且实际上可以建立一个模型,该模型可能能够评估给定建筑物的特定风险违反消防规范。因此,与其说,好吧,我们只需要列出建筑物的清单,然后进入城市并尝试找出问题所在,让我们根据任何给定建筑物可能存在问题的可能性来排序该清单。

所以他们继续有效地执行这项任务,试图收集和组织尽可能多的与这个问题相关的城市数据。所以很明显,他们有消防部门的数据,他们可以使用过去的检查,他们有建筑部的数据,这些数据有类似的建筑物横截面。但是还有许多其他数据可能与直观无关,但实际上可以告诉您很多关于建筑物可能存在问题的可能性。

例如,您有税务部门的数据。因此,您知道建筑物上是否有留置权,事实证明,如果是这种情况,则会大大增加那里可能存在问题的可能性。您还拥有卫生部门的数据,因此任何给定建筑物收集了多少垃圾。如果某栋特定建筑物违反了垃圾收集规定,这意味着它产生了更多的垃圾或有更多的垃圾从建筑物中排出,那么这也可能是违规的迹象,因为这可能意味着有更多的人在里面那栋建筑比他们应该的样子。

然后你有像 311 数据之类的东西,在纽约,它是一种非紧急城市线路,人们可以在那里进行诸如噪音投诉之类的事情,或者他们可以进行诸如垃圾投诉之类的事情或他们在城市中看到的任何难看的事情.所有这些信息也非常有用。所以团队最终做的实际上并不是一种技术上特别复杂的方法。我的意思是,实际上,他们所做的只是创建了一个包含所有这些信息的大数据表,其中每一行都是一座建筑物,每一列都是这些特征之一。

他们刚刚建立了一个大的逻辑回归;逻辑回归只会说,嗯,这些建筑物中的任何一个可能存在违规行为的可能性有多大?他们用它来创建现在所谓的基于风险的检查系统。这种基于风险的检查系统确实改变了消防部门的游戏规则。我不知道确切的统计数据,但我知道他们提高了命中率,基本上,他们发现违规行为的能力至少提高了 10 倍,甚至可能更高。

在我加入已经在市政府内颇有知名度的团队之后,事实上,我们在所有不同部门都获得了很大的兴趣。所以我帮助他们完成了一些真正支持经济发展的不同项目。我们为城市构建了一个类似的工具,实际上可以帮助小企业决定他们可能想从哪里开始。

所以,纽约市真正热爱的事情之一是企业家精神和人们创业,而不仅仅是软件公司。我们想要更多的自助洗衣店。我们想要更多的药店。我们想要更多的咖啡店。

但是挑战,让我们以咖啡店为例,如果你是纽约市的一家小企业,并且你想开一家咖啡店,你没有星巴克那样的资源他们可以派出一个团队来查看和统计客流量,并进行大量具体研究,以确定切尔西开一家新咖啡店的最佳角落。但纽约市实际上已经拥有大量此类数据,他们可以将其公开给市民,以帮助他们做出这些选择。

因此,与消防部门所做的工作类似,我在 MODA 时从事的项目之一是,市长数据分析办公室试图收集和构建一个地图工具,其中纽约市的潜在企业家或小企业主会说,好吧,我想在这个街区开一家咖啡店,最好的地方是哪里,哪里有出租机会,那里的租金是多少?而且该工具仍然可用。您实际上可以使用该工具。纽约市可通过其网站获得该工具。

我帮助他们解决了一堆基础设施问题。他们正在考虑使用一些新的数据库和新的分析工具。我还帮助进行了一些培训。因此,我们与团队进行了一些基本的统计编程培训。那是在彭博政府的领导下。而现在在白思豪政府的领导下,市长办公室的数据分析仍然相当成功。

Erik:我看到你在市长办公室工作几年前就创立了 Data Kind。因此,只需阅读其中的一些内容:当每一滴水都很重要时预测加利福尼亚的用水需求,收集数据以帮助改善患有精神疾病的人的生活,使用开放数据来发现潜在的腐败,通过数据科学创造更安全的街道。所以我在你的背景中看到了很多强调努力使城市环境更好地解决社会问题。现在你的公司 Alluvium 正在处理制造业,你是如何从对社会问题和城市数据的长期兴趣转变为专注于制造业的?

德鲁:如果在我的职业生涯中有任何一致的线索,正如你在顶部所说的那样,这是一条有趣而曲折的道路,那就是我一直对理解和思考如何构建帮助人们制作的软件工具非常感兴趣来自数据的决定,尤其是那些必须在某种约束下做出这些决定的人。

在我职业生涯的最开始,我实际上在美国情报界工作,并正在构建定制的集成工具和支持方法来执行我们所谓的全源分析,因为这是在数据科学作为实践标题的时代之前。这确实是我第一次开始考虑构建统计分析工具来帮助那些必须从数据中做出真正具有挑战性的选择并且需要快速完成的人,因为我有很多限制。

我在职业生涯的那部分工作中解决的问题,我们主要支持部署在伊拉克和阿富汗的特种作战小组。他们有一些问题,比如如果我们走在街上,安全吗?如果我们去敲这扇门,我们会找到我们要找的人吗?我们正在研究非常广泛的数据。因此,您希望在情报场景中看到的传统类型的数据,例如信号情报、电信记录之类的东西,以及非结构化的纯文本报告,并且必须考虑构建可以处理所有这些数据的工具来帮助该领域的一些决策者更有能力做出正确的决定。这段经历真正塑造了我对想要构建以这种方式帮助人们的工具的整体看法。

当我到达纽约时,我遇到了很多非常有趣的人并与之互动。其中一位名叫杰克波威的绅士,他也是最近来到纽约,当时在纽约时报研发组工作。杰克和我很快就成为了朋友,因为我们都渴望找到一种方法来吸引所有这些我们正在了解的人,他们正在研究这些真正具有挑战性的数据科学问题,但我们正在努力在广告技术之类的背景下,我们想弄清楚,好吧,你如何让人们点击这个特定的广告?或者他们在社交媒体环境中工作,我们说,好吧,我们如何理解如何让这个特定的帖子更受欢迎?

潜流是,虽然这项工作很有趣,但也许它并不能满足那些想看看他们如何利用自己的技能来帮助人们扮演角色的人。所以我们实际上开始 Data Kind 主要是作为一个实验,看看世界上是否有很多人有和我们一样的感觉。我们能否找到足够多的聪明的数据科学家、工程师、设计师,愿意自愿投入时间支持社会组织?最终,我们做到了。 Data Kind 现在已经成为一个非常成功的组织,世界各地的分会都在做这项工作。

所以,当我在考虑我想从 Alluvium 开始的公司时,我仍然在想,好吧,我想建立一家拥有最先进技术的公司,但最终该技术是为某人而建立的谁必须根据受约束的数据做出决策。而现实情况是,对于在复杂、连续的自动化过程、控制环境中工作的男性和女性来说,他们完全符合这种模式。

这是一个具体的例子。如果你有机会说走过炼油厂,一旦你克服了它有多热的事实,你接下来会被这些系统产生的数据量以及操作它们的人所淹没,并且必须想想这些数据告诉他们什么,以及它如何帮助告知他们的流程。

现实情况是,对于任何一个人甚至一个团队来说,管理和开发所有这些数据都很快成为一项不可能完成的任务。所以我们想做的是说,我们能否构建设计良好的软件工具,特别是以最先进的机器学习和人工智能为核心,以支持这些角色的人们,以便他们能够以快速和有意义的方式实际利用这些数据,并且回到从这些数据中做出决策,回到他们真正应该关注的工作上。

所以对我来说,过渡更多的是在哪里有机会开始应用这种想法。一旦我开始环顾四周,坦率地说,有在英特尔社区工作的经验,了解为超出我们通常认为的消费者或企业网络的数据构建技术的挑战对我来说真的很有吸引力.所以我再次见到它,与一群来自工业方面的人交谈并会见,他们真的告诉我这是现在市场上存在的一个真正的差距。所以这真的是我创立公司的火花。

Erik:只是对 Alluvium 的快速介绍,我从您的 LinkedIn 个人资料中读到此内容,“我们使用机器学习和人工智能将工业运营产生的大量数据流转化为洞察力,帮助您的专家专注于影响您的异常情况团队安全、生产力和底线。”所以这是一个水平的陈述。它可以适用于很多领域。我猜,任何在工业操作中使用重型设备的人。你今天的客户是谁? 2018 年,您真正与当地公司合作的细分市场有哪些?

德鲁:从广义上讲,制造业有很多很多,甚至很大的部分。所以对我们来说,我们主要关注过程制造和过程控制。所以,我已经提到了炼油厂的例子,比如下游石油和天然气、化学加工,更一般地说不一定是石化,而是其他化学加工,比如材料制造。所以我们在水泥和混凝土以及其他类似的领域工作过,比如化肥生产,从某种意义上说,这是化学加工的特定用例。

实际上,所有这些工业操作的统一主题是它们是大型、复杂的机械系统,以高度相互依赖的方式运行,并且一直在运行。与离散制造或装配线相反,其本身可能非常复杂,具有许多移动部件,但通常具有更多的线性关系。或者你可以想象一条汽车装配线,就像我们大多数人会看到一些视频一样,当汽车框架沿着装配线向下移动时,机械臂将零件焊接到汽车上。好吧,这些停止中的每一个都是离散的,并且这些操作按顺序发生。而在炼油厂中,所有这些化学物质会同时移动,因此我们倾向于关注这一点,因为我们认为我们的方法可以产生更大的影响,坦率地说,对客户来说更显着.

Erik:对你来说典型的项目是什么样的?就决策者而言,您与谁合作?谁将使用您的系统?项目如何开始?然后它在部署过程中会是什么样子?

德鲁:所以就我们最初与客户建立联系的方式而言,我想说我们最终与公司建立联系的方式通常有三种不同的方式。与我们合作的大多数公司,能源行业或化学品或其他更具体的流程制造部分的大型制造商,因此对于一些较大的公司,我确信他们会提供播客和你谈论的人到,数字化转型或工业 4.0 的概念在工业领域非常流行。

因此,有时这些组织中的某些人的具体职责是走出去,尝试将这些老牌大型组织与更现代、更新的技术公司联系起来。所以有人说像创新办公室的负责人,或者坐在某个组织内部寻求创新的特定团队。很多时候,我们会与这些人建立联系,然后从那里,我们可能会与某个特定业务部门建立联系,该业务部门的问题非常适合我们的核心用例。

我们通常向管理这些团队的人销售产品,无论是工厂经理本人,还是业务部门或团队的负责人,甚至是组织的 CIO,具体取决于组织的规模。

Erik:上周我和 Forcam 的 CEO 共进晚餐,他们专注于一级、二级汽车,然后是其他离散制造。他们的关键词是OEE,一切都在我们进入之前我们测量OEE,我们测量了3个月,我们测量了6个月,我们测量了12个月,他们的价值主张完全围绕OEE。

对你们来说,它看起来很稳定。你如何衡量这个?这是否会影响您的商业模式?如果我们可以改进一些稳定性指标,那么这就证明我们应该从试点升级到规模,或者我们有基于成功的费用?也许这是一个问题的两个部分。一、如何跟踪稳定性?然后是两个,这对您的销售流程或您与客户合作的方法以及验证您的解决方案是否产生影响有何影响?

Drew:所以,稳定性,无论是作为一个词,还是作为一个想法,在某种意义上都是 Alluvium 的核心价值主张。我们相信,如果我们可以帮助我们的客户了解他们操作的稳定性,当然,反过来,他们的操作的不稳定性,那么我们相信我们可以帮助他们完善他们的生产方式。

因此,对于我们来说,作为一个指标和价值的稳定性是我们技术的核心部分。所以,对我来说,我一直在构建这类平台,并考虑这些问题很长时间。而且,作为一般规则,当我考虑构建机器学习工具甚至只是一个决策支持工具时,必须努力从数据中发现新奇事物之间总是存在这种自然的紧张关系。因此,如果您有大量数据,您通常会与某人交谈并说,嗯,80% 的工作只是在挖掘和探索它,看看有趣的特征在哪里。然后 20% 的工作实际上只是构建模型或进行一些可视化来传达这一点。

因此,在工业运营的背景下,考虑到信息量和使用信息的方式,这是最难的事情。找到一种从信息海洋中真正挖掘出核心核心的方法确实非常具有挑战性。一个人,无论他们的统计知识多么复杂,或者他们特定的实质性或工业知识有多深,这从根本上来说都是一件很难做到的事情。但是对于一台机器来说,这对机器来说实际上要容易得多。

精心设计的机器学习系统非常擅长观察大量数据,建立内部直觉并表示该数据的模型可能是什么。然后随着新观察的出现,很好地了解该值是否是我们所期望的,或者它是否以某种方式偏离了我们的期望。所以对我们来说,稳定性,实际上我们所说的稳定性分数实际上是某个复杂系统整体运行的指标。

所以这个复杂的系统在某种意义上可以是非常宏观的。例如,它可以是整个炼油厂,我们想了解整个炼油厂的稳定性,因为我们想建立一个单一的指数,就像你建立道琼斯或标准普尔 500 指数来了解市场稳定性一样。我们想建立一个索引来为整个操作做这件事。然后该指数开始下降并变得不稳定,我们希望能够快速帮助客户确定不稳定的根源以及它是如何工作的?

所以对我们来说,这真的是核心,我们认为我们希望能够从不得不发现新奇和数据的压力中提取平衡或紧张,而另一端是对数据进行推理。因为就像一台计算机和一台机器特别适合自动化发现新奇和数据的担忧,特别不适合推理它。

计算机不知道为什么炼油厂或生产线可能会开始出现故障,但一个人真的很擅长。只有在这些系统中拥有 15、20、25 年工作经验的人才能看到一组价值观,然后说我知道这是什么。所以对我们来说,稳定性分数和这种稳定性概念实际上是在正确的时间将正确的信息传递给正确的人的眼球的一种手段,这样他们就可以快速做出决定,或者至少对正在发生的事情有态势感知他们的设施,而不必挖掘所有这些信息并自己进行发现。

当然,最后一点是,如果您构建系统时,当操作员看着屏幕或查看警报并说,好吧,这很重要,这就是我知道我需要做出决定的事情,然后机器学习系统可以从中学习,然后说,好吧,现在我对这个底层数据集中的一组重要的交互作用有了更多的了解我知道下次我的操作员寻找东西时要把它放在我的堆栈顶部。

因为我们认为为工业运营商构建软件的一个特别独特的挑战是软件并不是他们工作的真正核心。在制造设施内工作的人,甚至是管理他们的人,他们认为操作技术不聪明或 [听不清 26:38]。他们正在考虑如何将扳手转动到哪里,我应该将手电筒指向哪里?为了使这个物理系统正常工作,我需要做些什么?该软件只是为了支持这一点。

因此,如果我们可以让某人的注意力集中在屏幕上 5 到 10 分钟,我们希望确保这对他们来说是一种非常有价值的互动,并且系统总是利用它来变得更智能。因此,所有这些都为我们提供了这种稳定性的想法,无论是在软件的作用方面,还是在我们的操作员如何能够继续完成他们的工作方面,因为我们最不想做的事情就是构建一个从根本上改变他们工作方式的系统。因为 A,我们知道他们不会使用它,因为它们不会对他们特别有用。这意味着我们的系统不会变得更智能。这对我们来说是个问题。

Erik:感谢您收看另一个版本的工业物联网聚光灯。不要忘记在 IotoneHQ 的 Twitter 上关注我们,并查看我们在 IoTONE.com 上的案例研究数据库。如果您有独特的见解或项目部署故事要分享,我们很乐意在未来的版本中介绍您。写信给我们 erik.walenza@IoTone.com。

联系我们

欢迎与我们交流!
* Required
* Required
* Required
* Invalid email address
提交此表单,即表示您同意 IoT ONE 可以与您联系并分享洞察和营销信息。
不,谢谢,我不想收到来自 IoT ONE 的任何营销电子邮件。
提交

感谢您的信息!
我们会很快与你取得联系。