本周,我们采访了RoviSys的工业人工智能总监Bryan DeBois 。 RoviSys 是一家全球系统集成商,采用最有效的方法构建、分析、改进和维护复杂的自治系统。
在这一集中,我们将讨论自主人工智能的概念,它将基于机器数据的深度强化学习与基于主要专业知识的机器教学相结合,并通过模拟进行改进。我们还广泛探索了工业格局,包括成本结构、投资回报率目标、用例、云战略和 GPT4 等新兴技术。
关键问题:
● 什么是自主人工智能?
● 工业AI在人工智能S曲线中的地位如何?
● 适用于自主人工智能的用例有哪些?
● 自主人工智能的成本结构是什么?
音频文字.
Erik:Bryan,感谢您今天加入我们的播客。
布莱恩:是的,谢谢你邀请我,埃里克。
埃里克:我真的很期待这个。因为我们在 IoT ONE 上运行了几个与工业 AI 相关的项目,所以我也开始围绕我们正在进行的一些事情征求您的意见。
布莱恩:是的,让我们开始吧。
埃里克:酷。但在我们进入工业人工智能这个话题之前,我很想多了解一下您的背景。您已经与 RoviSys 合作 23 年了。所以你是一个非常忠诚的团队成员。所以我很好奇。显然,您在软件开发领域担任过许多不同的角色。作为工业 AI 总监,您是如何走到今天这一步的?
布莱恩:好吧,为了达到目的,我们必须谈谈 RoviSys 是谁。它于 1989 年作为控制系统集成商成立。因此,对于一些可能不太熟悉的听众来说,控制系统、控制器通常是工厂车间中最小的工作单元。它们是微型计算机,它们告诉所有其他设备该做什么。因此,如果反应需要加热或冷却,或者您需要将此产品移动通过此管道,所有这些都由这些控制器完成。作为一个控制系统集成商,我们的历史是我们会进去,我们会对这些控制器进行编程来做有趣的事情。
好吧,在过去 34 年中 RoviSys 作为一家公司的发展,我们增加了越来越多的功能。然后我们开始构建 HMI 屏幕。这些是人机界面。这些是操作员在运行工厂时使用的屏幕。然后我们继续对功能进行分层。其中一项能力,也是我从 2000 年开始在 RoviSys 的整个职业生涯中所涉及的能力,就是我们所说的信息系统。因此,这些都是位于工厂车间之上但位于业务系统之下的所有系统。所以介于两者之间的空间。他们收集所有数据,关联数据。他们可视化数据。这是所有分析往往存在的地方。
这是我感到兴奋的地方,因为在我看来,所有有趣的事情都在这里发生。因为在工厂车间,它可以生成绝对数量的数据。事实上,我们想说我们一直在做大数据,甚至在它真正成为 IT 世界的一个术语之前。我们正在做大数据,因为所有这些数据都来自工厂车间。我一直都在那个信息系统空间。当我还是一名程序员时,我就在那个空间里编程。然后我进入那个空间的 MES。然后我开始管理那个领域的项目。然后 OT 出现了,或者说云伴随着 OT 数据和 OT 数据仓库出现了,将所有 OT 数据集中在一起,收集并关联到我们使用的这些 Historians 中的这些巨大的数据仓库中,这些数据仓库是时间序列数据库——专门我们在车间使用的时间序列数据库。所以我正在做所有这些。
然后回答你的问题,然后在 2019 年,我们迎来了 RoviSys 成立 30 周年。我们有点坐下来,我们说,“下一步是什么?接下来我们应该追求什么?”因此,在那一点上,我们推出了三个水平。其中之一是我们的工业 IT 团队。他们实际上进去了。他们进行网络安全审计。他们封锁了车间。这确实是对我们听到的一些网络安全事件或故事的回应,这些事件或故事是我们听说过的有关主要制造商、勒索软件和类似事件的事件,这是对此的回应。第二个是我们的 MES 部门。那就是制造执行系统。这些是系统,类似于 ERP 的大型软件系统。但他们坐在车间里,他们告诉一切在车间里该做什么。组织一切,直接与 ERP 系统沟通,处理库存、生产的货物,诸如此类。然后我们创建的第三个部门,也就是我主管的部门,是工业人工智能。
我有这个强大的软件背景。我获得了阿克伦大学的计算机科学学位。因此,这对我来说是很自然的角色。但我会这样说。我有点不愿意接这个角色。不是因为我认为工业人工智能没有未来。我知道有。我只是不知道在 2019 年我们是不是行动得太快了,或者我们是否有点过早地推动这个故事。我清楚地记得我与客户的第一次会面,讨论工业人工智能。在这里,他们带出了两名数据科学家,他们的员工已经在用车间数据训练神经网络。这让我大开眼界。我发现我们没有迟到,但我们当然没有早到。所以我们真的觉得我们在正确的时间击球。因为我们有这些客户,他们有这些小团队之类的东西。他们已经在做人工智能了。因此,这是我们进入该市场的好时机。所以从那以后我已经做了将近四年了。
埃里克:有趣。思考技术总是很有趣,什么是 S 曲线,我们在哪里?我们在下层,中间吗?像工业人工智能这样的技术,很难知道。我们是否已经到达 S 曲线的中间、较高范围?也许结果会开始逐渐消失,我们将在今天的基础上持续适度改进。还是我们处于底部,正准备起飞?你有什么感觉吗?我想你可以看看人工智能——显然,你有不同代的技术——我们今天正在使用的这一代技术,这在很大程度上基于机器学习,然后是深度强化学习等等。您今天是否感觉到我们正处在 S 曲线上?
布莱恩:嗯,我认为我们已经过了任何形式的炒作,我会说。因为人工智能,如果我们像你在机器学习方面所做的那样定义它,在工厂车间使用以对制造商的运营产生变革性影响,那么我们已经在那里并且已经在那里很多年了。事实上,有些现成的产品是交钥匙的,您可以进行预测性维护等工作。我会提到它。他们是我们的合作伙伴——AspenTech Mtell。这是用于预测性维护的一键式交钥匙解决方案。它会为您进行异常检测,并且会进行 ML 方程式的预测。所以它已经存在了一段时间。它成立了。有很多客户看到了结果。
毫无疑问,工业人工智能的存在。它已经过去了炒作。我认为我参与了我的客户的大部分对话,因为我仍在对我的客户进行大量关于最先进技术的教育。他们听到的很多关于 AI 的内容——我们可能会谈谈像 ChatGPT 这样的生成 AI 之类的东西——他们听到的很多内容可能还不适用于我们生活的制造业世界.因为我们确实比世界其他地区落后五到七年。那是因为,嗯,出于很多原因,制造商倾向于规避风险等等。在我们所处的位置,我们刚刚看到 DRL 等技术的采用。希望我们可以在一分钟内详细讨论这个问题。我们将 DRL 打包成一个更广泛的产品,称为自主 AI。我们确实将其视为下一代,工业人工智能的下一步。
埃里克:太好了。我很想深入研究。让我们先详细介绍一下 RoviSys。当你组建这个团队或者当你在 2019 年成为工业 AI 总监时,你是否已经有少数人在做不同的事情?你是不是说,“让我们打包这些人”?或者就像是,“好吧,我们必须进入 LinkedIn 并尝试聘请合适的团队”?那在当时是什么样子的?
布莱恩:所以你问我的问题和总统在任命我为主任时问我的问题是一样的。他说,“好吧。给你。你打算做什么?你打算怎么办?市场是什么样的?我们需要聘请什么样的技能和人才?”所以花了一些时间把它们放在一起。不过,我发现的一件事是,在过去 20 多年里,我们一直在该信息空间开展项目,每次我们追求一种新型项目——构建 MES 或构建 Historians 时,我们都会进行一些线性优化问题,这对于水力发电大坝来说真的很酷——每次,我们都聘请了多面手。我们聘请了计算机科学家和计算机工程师。他们了解制造和工业领域,因为我们很快让他们进入工厂,我们让他们很快与客户交谈。所以他们非常了解这一点。然后他们能够适应我们抛给他们的不同技术问题。所以我估计我们可能会做同样的事情。所以我们聘请了我们在所有其他项目中使用的相同软件和计算机工程师,我们教他们数据科学。
我的假设似乎已经被证明是正确的,即向 OT 专家传授数据科学比向数据科学家传授 OT 更容易。对于你的一些听众——因为我一直使用这个术语,所以我有时会忘记定义它——当我说 OT 时,操作技术。所以我认为这是 Gartner 在 2006 年创造的一个术语,因为他们需要的不是 IT。每个人都知道 IT 是什么,也明白那是什么。 OT 实际上是关于工厂车间的,实际上更定义为设备和使事情移动、发生或通常在工厂车间生产的东西。但它可以适用于你什么都不做的管道发电等事情。你只是在移动产品。那是加时赛。
因此,教那些 OT 专家数据科学似乎是可行的方法。有趣的是,与客户交谈——我不想从数据科学家那里拿走任何东西,因为他们中的许多人都很聪明——我们从他们那里听到的是,很多时候这些数据科学项目正是因为这个原因而停滞不前。因为他们从外部聘请了数据科学家,他们真正了解数据并且真的可以——我的意思是,他们可以建立预测模型,并且可以证明它们具有预测性。但他们不知道如何在车间实际实施。所以我们称之为可操作的 AI。我们认为这是这些会议中通常缺少的关键部分。因为坐在桌子周围的每个人都看着其他人说,“好吧,你要部署它了。”好吧,我不知道如何部署。你部署。因此,我们是真正可以坐在桌子旁说的人,“是的,我们了解如何将 ML 模型部署到必须全天候 24/7 运行的工厂。我们了解尝试带来的组织变革和管理让操作员和主管开始信任这个模型,而不是他们自己长期培养的眼睛、耳朵和鼻子。我们了解所有这些因素,然后考虑模型再训练等事情。因为这些模型会漂移随着时间的推移。所以我们也明白这一点。所以我们觉得我们可以很好地弥合这两个世界。我们发现这是 RoviSys 的差异化因素。
埃里克:这很有趣。几年前,我们与西门子进行了非常相似的对话,西门子是我们的大客户。实际上,我们在同一时间框架内帮助他们为他们的一项业务定义人工智能大数据战略。我们到了要说的地步,“好吧。现在我们觉得你知道你想做什么了。现在你打算怎么做,谁来做?”我们进行了同样的谈话,“好吧。我们要不要尝试去——”这是在中国。 “我们会尝试从腾讯和阿里巴巴以及所有科技初创公司那里吸纳人才吗?但是,那些人会坚持下去吗?他们会在这里待两年然后跳槽吗?还是会更有效的只是说,让我们找一些在你的团队里工作了七年的人。你了解他们。他们了解业务。你知道他们购买了这个行业,并且他们有点嫁给了行业。让我们提高他们的技能,给他们一个重新定义职业的新机会。”
那是他们走的路,而且看起来真的是对的路。因为现在市场上有很多工具可以帮助人们学习数据科学。现在不像 20 年前那样需要博士学位。现在您需要学习一些访问和工具包,并且您已经知道如何编程。所以在很多情况下,这看起来确实是正确的方法。关于 RoviSys 的最后一个问题,Bryan。你的客户——我看到你有点流程化、离散化和建设性。你能举一些例子吗?在这些不同的垂直领域,典型的客户对您来说是什么样的?
布莱恩:是的,我们的每个垂直领域,我认为我们现在有大约 13 个垂直领域——从生命科学到化学,到石油和天然气,就像你说的,离散制造,到楼宇自动化。每一个,它总是有点有趣。因为每个垂直行业都有非常具体的需求。这就是我们以垂直方向为导向的原因。实际上,我们的部门实际上是在组织内部按垂直部门划分的。都是那些垂直行业的。那是因为,这些垂直领域中的每一个,他们都说不同的语言。他们有非常具体的痛点和用例等等。然后我们有专职的工程师只在那个行业工作。因此,它使我们能够走进一个房间并迅速与该客户建立信誉,因为他们知道我们已经做到了。我们使用的是他们惯用的相同术语。我们谈论的是相同类型的设备和相同类型的问题。因为,再一次,当你专注于这样的行业时,问题是非常可移植的。你开始看到不同客户之间的相同可重复性,“哦,我敢打赌你遇到了这些类型的问题。”哦,是的,我们是。所以这立即给我们带来了一定的可信度。
然后我们得到了这三个。我来谈谈。我们称它们为水平线。工业AI是横向的。在我的团队中,大约有 22 名经理和大约 25 名工程师。我们四处走动,帮助服务所有其他垂直行业。有趣的是,我最终不得不做我自己,而我的团队必须成为万事通。因为我必须能够针对我们服务的所有 13 个不同行业的痛点发表意见。但另一方面,为了解决你关于我们看到的典型客户类型的问题,随着 RoviSys 的发展,看到这一点真是太好了。当我开始时,大约有 150 人。现在我们在全球范围内拥有 1,200-1,300 名员工。看着这种演变,项目变得越来越大。客户变大了。这些是我们服务的财富 500 强、财富 100 强客户。赌注更高。投资回报率更高。一切都更大了。团队更大。项目运行时间更长。但这一切都非常令人兴奋。好有趣。这很棒。
埃里克:酷。好吧,让我们来看看是什么让这令人兴奋。我认为你可能在公司中处于一个非常独特的位置,将公司推向新的领域。工业AI这个话题,我猜你已经给我们讲了过去20年的高水平,我们今天在哪里。那么,为什么我们不从今天和最前沿开始,也许是自主人工智能的概念呢?这意味着什么?为什么它很重要,我们今天在车间或建筑物中实际部署它的能力如何?
布莱恩:是的,所以要谈论自主人工智能,了解一点深度强化学习是很重要的。因此,对于您的听众来说,到目前为止我们讨论的所有工业 AI 几乎都可以分为两个不同的类别。这就是异常检测。这就是你将它连接到一条线路的想法,它会监控那条线路。它会在没有任何先验知识的情况下随着时间的推移而学习。它会随着时间的推移了解正常情况。然后它将开始能够告诉你什么是异常。这就是异常检测。它已经存在很长时间了。
第二种类型是预测性的——从预测性维护到预测性质量的一切。其背后的想法是它可以预测一个值。这是该设备发生故障前的天数。这是明天的温度。这是完成后该批次的可能质量。它可以做出单一的预测。您如何处理该预测取决于您。您是必须采取行动并据此做出决定的人。这就是价值的来源。这两类 ML,机器学习,这就是我们去过的地方。
第三类是深度强化学习。这是一个全新的机器学习类别。它登场了。它的大型亮相派对大约在 2016 年举行。它来自 DeepMind,后者是 Google 的衍生产品。当它出来的时候,它是以一个叫做 AlphaGo 的程序的形式出现的。它与李世石对决,李世石是我们的人类围棋大师之一。它击败了他,四比一。然后他们构建了 AlphaZero,它继续击败了我们一些最好的国际象棋大师。然后它击败了我们最好的国际象棋程序。然后他们创建了 AlphaStar,它击败了我们最好的星际争霸玩家。所以他们找到了一些东西。它在技术界引起了很多人的注意,因为这是新事物。所以大约在那个时候,有几家公司开始应用这种新的 DRL 技术,不是用来玩游戏,而是用来解决工业问题。所以它是从中发展而来的。
但为什么 DRL 不同于任何其他类型的 ML,它坦率地做了人们认为 AI 可以做的事情。它说,“接下来我应该做什么?鉴于系统的当前状态,我可以采取的下一步最佳行动是什么?”有趣的是:现在,如果你考虑一下,如果我们拿国际象棋做类比,那么如果它出现在一个棋子上,好吧,如果它只是一种贪婪的人工智能,它就会抓住那个棋子。好吧,也许这是下一个最佳举措。但也许不是。如果你的目标是赢得比赛,如果你考虑到它与大师对战并获胜的能力,它就不能只抓住下一个可用的棋子。它必须制定长期战略,而且它可以。这是它与之前的任何其他 ML 的区别之一。我从未见过任何其他 ML 可以像这样构建长期战略。因此,DRL 是这场自主人工智能革命的核心。
不过,它还有另外两个关键方面。其中之一称为机器教学。机器教学背后的想法是,你实际上将你的一些东西编纂成法典——我们与最好的中小企业、最好的操作员、最好的主题专家讨论了如何运行一条生产线。我们与他们讨论了他们使用的技能、策略和概念。他们谈论它。他们如何谈论生产线的运营?如果它处于这种状态,很多时候当你和他们交谈时,他们会说,“好吧,如果它处于这种状态,那么我们就这样运行它。”我刚刚和一家乙烯基制造商交谈。他们有两个主要的树脂供应商。所以他们说,“好吧,如果我们从某某供应商那里得到树脂,我们倾向于这样运行生产线。如果我们从这个供应商那里得到树脂,我们倾向于这样运行。我们运行得更热一些。我们跑得更凉快一点。我们跑得快一点,慢一点。”这些策略随后成为我们机器教学的一部分。所以我们融入其中,那些技能。
现在你为什么要那样做?人们很想说,好吧,让 DRL 学习所有这些东西。从一张白纸开始,让它学习所有这些东西。好吧,问题在于它可能需要 1000 年才能学会所有这些技能。另一件事是,这甚至不是你教人类操作员的方式。如果你要教一个人类操作员,你会进来。你会说,“好吧。这就是你要做的。如果它运行很热,你就这样做。如果它运行很酷,你就这样做”你要教他们同样的策略。所以我们给它同样的开始。然后它仍然有足够的状态空间来探索和弄清楚。它这样做的方式是第三个支柱,即模拟。
自主 AI 的关键是它在实践中学习,而不是通过数据学习。所以你需要一个模拟环境。我们可以谈论更多。但这是一个有趣的挑战。因为仿真在制造领域并没有那么普遍,至少现在还没有。所以这是我们必须克服的挑战的一部分。
埃里克:明白了。好的。所以自主 AI 是深度强化学习,加上机器教学,你基本上为它提供了一组已经存在的组织学习的基础,再加上通过模拟学习。
布莱恩:模拟,是的。
埃里克:自主 AI 擅长的用例是什么,也许它不太擅长的用例是什么?
布莱恩:这就是为什么我对这项技术感到非常兴奋。因为 RoviSys 是系统集成商或 SI。那么我们该怎么办?我们将系统集成在一起。这就是我们所做的。 RoviSys 没有我们自己的 IP。我们不是产品公司或类似的公司。我们寻找可以解决很多问题的技术,我们可以用这些技术解决很多用例。相比之下,当 Historians 在 2000 年代初真正开始时,90 年代末,当 Historians 真正开始在市场上流行时,我们就赶上了这股潮流。我记得,在我职业生涯的早期,我曾向客户解释什么是 Historian 以及它可以带来什么价值。如今,每个客户都有多个 Historians。但我们喜欢的是你可以将它应用到各种不同的行业来解决各种问题。嗯,早期的自主人工智能,但它看起来像我们喜欢的那种瑞士军刀。
因此,为了回答您的问题,我们正在使用它来解决与生产调度一样完全不同的问题,这是一个相对较老的问题。从这一切到我们有一个炼油客户正在使用它来直接控制在蒸馏塔中抽取柴油以进行精炼过程。这就是我们真正喜欢它的地方。任何有人类参与的事物,任何需要类人决策的事物,都是应用自主人工智能的完美用例。不太好的地方是已经有了很好的解决方案的问题。所以你不会将它用于标准控制。因为 PID 循环就是这样做的。很长一段时间以来,他们一直做得很好。
甚至像 MPC 这样的东西。我们甚至不一定将其视为 MPC 的竞争对手。事实上,在我们的一些解决方案中,我们已将其与 MPC 结合,其中自主 AI 位于 MPC 之上。 MPC,我总是把它比作一个自动驾驶仪,一个非常强大的飞机自动驾驶仪。在自动驾驶仪中,如果在飞机上,如果你告诉自动驾驶仪你将其锁定,它会带你从 A 点到 B 点。它会绕过它可以处理的某些事情以及类似的事情。当它发生变化之类的事情时,它可以处理所有这些。但它所能做的就是让你从 A 点到 B 点。它不能告诉你它应该去 B 点。你需要一个飞行员来做到这一点。
这就是自主人工智能的用武之地。它实际上可以做出这些类型的决定。我可以去 B 点,也可以去 C 点。哪个对我来说更合适?它可以通过 sim 学习并重新学习来做到这一点——它会运行数小时甚至数天。但在那个时候,相当于跑了 100 年。这相当于当了 100 年的操作员。因此,它从培训课程中脱颖而出,就好像它是一位经验丰富的操作员,什么都见过。我们做这些叫做课程的事情,我们会向它扔疯狂的曲线球。好吧,在这种情况下,生产计划会发生什么。如果该设备出现故障会怎样?现在建立一个最佳时间表。如果您有一批来自您最好的客户的热销订单,会发生什么情况?现在建立一个最佳时间表。所以我们抛出这些曲线球。
另一件事很有趣。我在一个贸易展上展示了这个。我得到的问题之一是,好吧,好吧,但是模拟必须有多好?看起来它必须非常非常准确。我说,嗯,不。事实上,如果你给我一个非常非常准确的模拟器,我们实际上做的就是引入噪声。因为现实世界有噪音。所以这个大脑,他们被称为大脑。当它受过训练时,它就有了大脑。这些大脑必须能够处理现实世界的噪音。我们将引入不良信号,以便它必须处理并学会解决这个问题。无论如何,这就是它随着时间的推移学习的方式。
埃里克:是的,很有趣。我认为,这个模拟主题在这里非常关键。因为如果你没有好的数据,那将成为工厂车间许多机器学习的瓶颈之一。就是你没有那么多毛病吧?
布莱恩:对。
埃里克:我的意思是,目标是没有错误。所以你说,“好吧,给我一个有一堆错误的数据集,这样我就可以训练它了。”它说,好吧,在过去的 10 年里,我们有 10 个这样的人。但是我们不想再有一个,因为每个都要花费我们 1 亿美元。那么,就能够生成用于训练的模拟数据而言,我们今天处于什么水平呢?同样,也可能为此使用 AI。几周前我刚刚和某人谈论过也使用 GPT-4,那里有一些应用程序可以生成高质量的模拟数据。那你今天怎么样?你的方法是什么?
布莱恩:我们基本上将模拟分为三个不同的类别。第一个是所谓的第一原理模拟人生。这就是每个人在想到模拟时都会想到的。所以你正在使用高级计算来计算我们对物理学或流体动力学的了解。您在这些计算中模拟了现实世界。那些很棒。我们的一些客户已经拥有其中一些东西。那里实际发生了什么,我们有一个客户,特别是拥有一个整体——他们是一家玻璃制造商。他们有一个流体动力学,一个用于该过程的第一性原理模拟流体动力学模型。问题是该过程在我们试图优化的两秒钟内发生,而模拟器花了 24 多个小时来运行其中一个循环。所以我们实际上不能使用模拟器,第一性原理模拟。那么我们必须看看其他类型之一。第二种是所谓的离散事件模拟。这主要用于生产调度之类的事情,或者我们已经与制造商完成了一些吞吐量类型的项目。但一切都是离散的步骤。所以它只适用于某些类型的问题。
我们实际经常使用的第三种类型是所谓的数据驱动模型。这就是我们可以从历史记录中获取数据的地方。我们实际上可以将它与一些传统的机器学习机制混合来创建数据驱动的模拟。它会有局限性。我现在就告诉你。因此,第一性原理 sim 具有我们所知道的关于物理学的一切能力。好吧,这不会。如果它从未在现实世界中发生过,它就不会出现在历史记录中。因此,通常,它给了我们一个良好的开端。但是,我们必须扩展状态空间。我们必须尝试并做事。
因此,对于那个玻璃制造商,我们有一个很好的数据驱动模型。但现在我们正在做所谓的实验设计。他们有一条研究线,所以我们能够做到这一点。但是在生产运行之间,我们让他们做一些你在正常情况下实际上永远不会做的事情。他们的形状真的很奇怪——他们是瓶子制造商。他们制造了非常奇怪的瓶子之类的东西,确实想扩大那个状态空间。我们在 Historian 中记录所有这些,这样我们就可以将这些数据添加到数据驱动模型中,并制作一个更强大的模拟。但再次回到那个人在那个贸易展上的问题。它不一定是——我们不必涵盖每一个州。我们可以做出一些假设并融入其中的一些假设,DRL 仍然可以从中非常有效地学习。
埃里克:让我给你一个情况。我很想听听您对是否可以使用它来解决这个问题的想法。所以情况是涡轮机制造商为大型水力发电厂或其他发电厂制造涡轮机,他们偶尔会在部署涡轮机的地方遇到问题,并且会出现一些故障。它会破裂。然后他们花了三个月的时间和数百小时的工作来弄清楚问题是什么。因为它是离散制造,所以他们在工厂中没有 1,000 个传感器。他们试图弄清楚,是不是因为我们有不同的铜制造商,化学成分不知何故发生了轻微变化?还是因为我们在生产线上出了问题,或者我们在炉子上跑热了?这是什么?
所以基本上,这是查看历史机器数据的组合——当然,他们确实有一些机器数据——但也查看了在那里工作的流程。它正在进行一堆对话。然后你带着一份大报告出来了。生成了一堆 PDF 文件。所以我们正在研究这个问题,然后说,很多公司都有这种情况的某种变体,在这种情况下,你会遇到偶尔会发生的大而混乱的问题。机器数据不完善。但是,你有这些历史报告,其中有一堆 PDF 和一堆信息,这些信息要么被锁定在文档中,要么被锁定在人们的大脑中。
所以问题是,是否可以让算法在机器数据上进行训练,同时也可以阅读所有以前的故障报告的 PDF 文件以及可能的规范、文档和所有这些非结构化文本文档。甚至可能采访工程师并说,“嘿,你怎么看这个?你认为这可能是什么问题?”基本上,创造这种知识,这个 Copilot 或这个知识数据库可能会说,“下次出现问题时,我认为可能有三个潜在的根本原因。你应该检查 X、Y 和 Z。”但是,比方说,这是一种混乱的根本原因分析,它不是一种过程制造环境,在这种环境中,您在过程的每个阶段都有大量数据。就能够深入了解这种情况而言,我们今天处于什么位置?
布莱恩:是的,那么自主人工智能要解决的问题是什么?现在的挑战是你遇到了更多的知识问题。所以你提到了 ChatGPT 和生成人工智能。我相信现在还为时尚早。但它似乎更像是解决这些类型的知识和知识图类型问题的正确工具。自主人工智能尤其需要模拟。你所描述的一切,我都在试图弄清楚你实际上会模拟什么。
它能做到这一切吗?是的,但我认为这不是完成这项工作的正确工具。因为为了让它做到这一点,你能确定地模拟涡轮机吗?你能模拟故障模型和类似的东西吗?但我不知道你会如何模拟它采访人和事。同样,在语言和知识类型的问题上,这似乎更像是 ChatGPT 类型的世界,而这更像是一种操作技术。因此,您将再次使用它来解决更像是操作类型的问题。
埃里克:好的。清除。您看到集成不同 API 或算法的价值了吗?因此,假设您有一个适合解决运营问题的自主 AI 系统。但是,你也有一些非结构化信息,也许你想要一个更具对话性的用户界面等等。因此,GPT 作为用户界面或可能用于集成其他界面可能更有用——基本上,也许你可以将自主人工智能的输出输入 GPT,然后说,嘿,这是系统的输出。这里有一些额外的信息。基于此,您建议我们做什么?
布莱恩:现在你开始了。这是完全正确的。所以我们正在研究的方面之一,我想,我忘记提到关于机器教学的是,当我们列出所有这些概念时,我们实际上可以利用。您实际上将它们布置在工作流程中。我们实际上可以在某些时候利用 DRL,但我们可以利用其他 AI 技术。
例如,我们有一个客户正在使用视觉系统,他们正在使用非常传统的 ML 类型的模型来对视觉系统所看到的内容进行分类。然后它只是向 DRL 发送一个分类。就是这个图案就是这个图案就是这个图案就是这个图案这是它可能的五种不同模式。所以现在你正在结合。机器教学可以让你将那些传统的 AI 技术与 DRL 结合起来,真正获得一些超能力。所以,绝对,这就是我认为你所说的。我认为这才是自主人工智能的真正未来。它是开始将一些知识系统(如 ChatGPT)纳入其中并做出一些初始决策,然后将决策提供给 DRL 以供学习。
埃里克:好的。知道了。这说得通。是的,这是我们非常兴奋的事情。因为在中国——我想在美国也是如此。你有这个。好吧,很明显,现在美国的情况很相似——每个人都很难招聘到熟练的工程师,等等。所以问题是,你如何让一个人做两个人的工作,或者你如何让一个 27 岁的人做一个 45 岁并且对工厂了如指掌的人的工作?显然,我们需要新的工具来做到这一点。
布莱恩:并在此基础上快速发展,因为它是上周才发生的。我在客户现场,与厂长进行了坦诚的交谈。他说,“我们在这一行需要自主人工智能。”他说,“我会告诉你为什么。我有两个最好的操作员,经验丰富的操作员,他们已经在这条生产线上运行了十多年,他说,他们可能退休大约五年。”他就像,“我的替补席上没有人。我有一到两年的运营商。我在这个角色上的流动率很高。”他说:“我不知道还能做什么。”他说,“我必须在这里拥有自主人工智能。我们基本上有五年的时间让它工作——不会花那么长时间——把它改进到他可以让一个一到两年的人安顿下来的地方。我们烤了将那些经验丰富的操作员的所有专业知识都融入其中。他可以让一个工作一两年的操作员在上面工作,这个操作员可能会在几周内辞职,并且仍然能够按照他现在的产量生产。
因此,为了强调这一点,绝对是一个巨大的问题。所以,就像你说的,这个人工智能领域现在有两个方面。有运营,我们认为自主人工智能解决得很好。然后是知识问题,同样,ChatGPT 是大型语言模型中的世界,事情似乎正在解决这个空间。
埃里克:也许我们可以快速谈谈围绕此的一些商业话题。也许第一个是成本结构。如果您正在培训,成本结构是什么样的?现在,技术平台、培训过程、基础设施和系统集成占多少百分比?
布莱恩:基本上,现在看起来是这样的。这种自主人工智能仍处于起步阶段。所以很多,它的很多方面仍然是开源的。但是我们有像 SaaS 这样的供应商,我们正在与之合作——我不知道你是否熟悉 SaaS——我们能够在他们的平台上做一些事情。那么你就有了 Microsoft Azure ML。您拥有 AWS SageMaker。所以我们可以结合其中一些不同的技术来解决同一个问题。这是一种方法论。这是一种方法。它不是产品。因此,我们正在利用在开源世界中开发的这些方法并应用它们,利用这些产品。
那么它看起来像什么?它有一个服务部分。这是它的 RoviSys 方面。所以我们将花几个小时与你们的专家坐下来,我们将尽可能地了解他们如何运行生产线的各个方面。或者在生产调度的情况下,我们将与您的专家调度员坐下来讨论,“当三号线全天停机时,您如何处理?您仍然如何制定时间表?”所以我们要学习所有这些。我们将通过机器教学将其融入其中。然后我们将通常使用云对其进行训练。
模拟,我想我也应该解决这个问题。利用模拟器有一个完整的方面。生产计划是油漆制造商。他们实际上已经构建了一个离散事件模拟器。他们用它来围绕资本支出类型的决策做出决策,比如,我们应该增加更多设备吗?这会以我们认为的方式增加我们的吞吐量吗?所以他们已经构建了这个离散事件模拟器,然后我们利用它来训练大脑进行生产调度。我们必须确保有模拟。我们可能必须建立一个 DDM,一个数据驱动的模型,我们现在正在为很多客户做这件事。所以我们必须做所有的前期工作。然后我们进行机器教学。然后,当我们进入培训部分时,我们通常会利用云。因为它要横向扩展。我的意思是,它可能同时运行多达 100 个这样的模拟,而且运行速度非常非常快。因此,我们通常确实需要云类型的规模。
在成本方面,到目前为止,您已经向我们支付了服务费用。但是,您已经支付了一些云成本。我的意思是,到目前为止,计算的云计算成本并不高。然后,一旦你拥有训练有素的大脑——这就是我们所说的;这是一个大脑——被出口了。现在的大脑实际上只是一个训练有素的神经网络。没有比这更奇特的了。它在商用硬件上运行。它可以在任何英特尔芯片上运行。因此一旦它从云端导出,它就可以在任何地方运行。它可以在本地运行。它不再需要连接到互联网。所有的训练都完成了。现在所有的知识都融入其中。然后它就被部署了。那么,最后一个涉及成本的地方就是部署故事。
我们有一些客户想要做所谓的决策支持系统,这通常是我们开始的地方,我们建议他们开始。这就是我们要在这个大脑上构建网络界面的地方。它将位于工厂车间操作员控制屏幕旁边。它将监视控制系统的状态。它会给出建议,好吧,我会建议多转动一下这个转盘。我建议将此拨盘调低,将滑块调高。它将提出这些建议。现在,无论操作员是否这样做,它都可以对其进行监控。但如果状态改变,它会说,好吧,你没有听我的。但没关系。现在,这就是我要做的。这是我要做的下一个最佳事情。但是,我们有一些客户,炼油客户正在寻求这种方式,我们从决策支持转向直接控制。现在我们实际上已经将它连接到控制系统中,它直接向控制系统发送命令。
现在,这听起来很可怕。但要记住的一件事是,它不能做人类操作员不能做的任何事情。我们安装的每个控制系统都有特定的联锁装置、特定的参数和人类操作员可以做的事情的界限。您只能将此滑块移动到此为止,然后他们会阻止您。如果我们想对其中一个大脑进行限制,我们实际上可以进一步限制参数。我们为人类操作员设置的相同类型的控制和安全措施,所有这些仍然适用于大脑。所以你在部署方面有一些成本。但它们不是便宜的项目。我不想给人这样的印象,因为有很多咨询。有很多实验。有一些死胡同。我会说,它们通常运行 8 到 12 个月之间。这通常是我们为这些项目之一拍摄的内容。但正如我所说,它们不一定是廉价项目。而且,我们只针对非常大的投资回报率。我们正在寻找巨大的投资回报率。
我和一位客户交谈,他估计他们每年造成大约 100 万美元的浪费。实际上,对我来说,这似乎可以运行得很好。我和很多客户谈过,他们的垃圾数量在几千万或几百万。但我们希望将这种浪费减少 50%。如果我们能做到这一点,那每年都会节省一大笔钱。所以我们正在追寻那些大的,在某些情况下,数百万或数百万美元的问题。我们正试图在很多流程中将针头移动 1% 到 3%。那是很多钱。
埃里克:嗯,没错。接下来我想深入了解一下 ROI 这个话题。我猜你可能有两种不同的高层,两种不同的场景。一个是纯粹的财务投资回报率,好吧,如果我们做出这些改变,我们可以说每年 500,000 或 200 万,或者任何数量。然后你计算投资回收期并据此做出决定。然后第二个是一家公司说,“我想回岸,因为我需要在美国拥有 X% 的生产,以便能够访问某些客户群或任何可能的客户群,或者降低我的供应链风险.我只是找不到人。所以我需要能够做到这一点。否则,我将无法实际生产出市场想要的产品。”
现在,你在驾驶它时看到了什么?这更像是一个纯粹的财务决定吗?它是否更像是公司的战略决策,说我们需要这个才能在我们想要的市场中占据一席之地?
布莱恩:是的,我肯定会说我的大多数客户现在都是根据经济原因做出决定的。但是我们有客户,就像我说的那样,我上周刚刚和你谈过,我们通过投资回报率谈过。财务在那里,但它有点边界。不过没关系。他说,“我不在乎。没有这些专业操作员,我无法运行这条生产线。”就像你说的,没有技能。没有劳动力。没有人才进来。所以如果我想拥有一家工厂,如果我想拥有这个,如果我想能够生产任何东西,我就必须这样做。所以对他来说,这几乎是存在的。他必须这样做。
我认为可能会有更多。但是,是的,现在,我们的很多客户仍然根据美元和美分做出决定。我总是试图向他们强调的一件事是:这是一个新的、未开发的领域。好吧,DRL 一直存在。同样,制造业总是落后五到七年。对我们来说,这是非常前沿的。所以现在很贵。最终,它会成为一种商品,并且可能会融入到软件包中。您只需拨动几个开关即可免费获得它。但现在,事实并非如此。有很多定制。有很多实验和很多以前没有人试图解决过的问题。因为你总是让一个人来做。这些是我们要解决的问题类型。我们现在正在寻找更大的投资回报率,直到它变得更像是一种商品。好吧,随着时间的推移,也会有更多的产品和类似的东西出来帮助支持我们。我对此很有信心。
埃里克:你今天在市场上发现了什么?您认为对您的客户有意义的合理投资回收期是多少?
布莱恩:嗯,在我 20 多年的制造业经验中,感觉投资回收期变得越来越紧。我的意思是,现在似乎每个项目都需要 12 个月的投资回收期。至少,一个月收支平衡。所以这差不多了。所以这个也是一样的。他们希望能够在一年内看到结果是好是坏。从这个角度来看,它促使我们变得更好。
埃里克:明白了。好的。其他一些我想真正快速触及的话题只是为了看看这里有什么有趣的。所以其中之一,我们已经触及了云。我了解培训需要在云端进行。今天,您的客户对在云上实际运行 AI 流程的接受度如何?每个人都还想要内部部署吗?他们愿意接受私有云甚至公有云吗?
布莱恩:是的,所以这是一个我经常被问到的问题。如果我们看一下典型制造商的总体运营情况以及他们的云风险水平,显然,数据收集、离线数据收集、离线数据分析,每个人都对在云中投入使用感到非常自在。就数量而言,他们通常需要云存储,因为它比将其放在本地更便宜。所以这是非常可行的。如果你再往下看,我谈到的这些制造执行系统,如果一切都设计良好并持续几个小时,它们通常可以在不与 MES 通信的情况下继续生产。所以通常情况下,我们有很多客户正在认真考虑将他们的 MES 系统放在云端。历史学家,比这些时间序列数据库低一个级别。我有很多客户愿意把它放在云端,因为他们可以缓冲数据。他们将失去联系。但是任何对系统至关重要并且实际上会影响他们无法再生产的操作的东西,我没有任何客户愿意将这些类型的系统放在云中。
因此,要回答您关于云中人工智能和运营人工智能的问题,这要视情况而定。我有一些客户想要进行所有的数字运算,并可能做出一些关于更好的设定点和类似事情的决定,然后能够将这些设定点反馈回工厂车间。这都是非常离线的、异步类型的过程。在云中没什么大不了的。我还有其他客户。我有一家石膏板制造商,他们训练了一个模型来检测石膏板的质量,然后通常会在石膏板送到质量实验室之前几小时,这真的很酷。基本上,实时检测石膏板的质量。这需要排队完成。因此,他们在云中进行 ML 模型的所有训练。但是随后,他们将其部署在边缘。所以答案是视情况而定。始终,我们会在任何给定情况下根据风险和类似情况向客户提供适合他们的建议。
埃里克:明白了。然后另一个技术主题,只是在这里戳一下,是 5g 的问题。很多人问我,我们如何在工业中使用 5g?那么问题来了,工业人工智能有没有用例?你会说,是的,5g 实际上会启用用例,否则将难以部署?有这样的东西吗?或者它总是,不,但你可以使用 Wi-Fi 6 或其他什么?
布莱恩:对。所以我不是 5g 专家。就像我说的,我们有一个完整的工业网络部门。他们整天谈论 5g。不过,我的理解是,在我担任这个角色之前,我一直在解决问题。我做了很多工作。我不知道为什么。它恰好发生在我们的金属和采矿业务中。所以,很明显,如果你是一家钢铁生产商或其他什么公司,最大的问题之一就是一切都是金属。在很多这些地方,每个 Wi-Fi 几乎都无法启动。我的理解以及已经完成的一些早期实验和早期概念证明是,5g 可以渗透到我们过去无法使用 Wi-Fi 的一些困难环境中。所以我对此很兴奋。
老实说,它仍然是相同类型的风险分析类型的问题。就像,好吧,如果你失去了 5g,如果你失去了连接,会发生什么?你仍然必须能够做出决定。对我们来说,我们总是在谈论什么是关键路径,什么对运营至关重要。如果这个 ML 模型,如果需要做出这些 AI 决策以便您生产产品,并且随着 AI 变得越来越普遍,它越来越成为日常关键工作流程、关键路径的一部分,那么它就不能依赖任何一种连接技术。
埃里克:明白了。好的。伟大的。布莱恩,我真的很喜欢这次谈话。也许最后一个问题是,未来有什么让您兴奋的,无论是直接在 RoviSys 还是更间接地在市场上?现在什么让你兴奋?
布莱恩:人工智能,它有很多文艺复兴时期。感觉就像另一个。所以我对我现在正在使用这种自主人工智能的东西感到非常兴奋。如果您的听众中有任何人想了解更多信息,可以阅读 Kence Anderson 的一本书。他有点写了这本书。他咨询了 RoviSys。设计自主 AI,您可以在 O'Reilly 找到它。我认为这真的很令人兴奋。然后我认为微软即将在 Microsoft Office 中推出的 LLM 东西、ChatGPT 东西、Copilot 东西,我认为这真的很令人兴奋。这会让很多人大吃一惊——能够利用 ChatGPT 类型的技术编写 Word 文档,或编写 Outlook 电子邮件,或开始为他们提供 PowerPoint 演示文稿的起点。这真的很令人兴奋。
Erik:您是否已经为任何客户部署了 GPT,或者您预计什么时候会在制造环境中找到真正的用例?
布莱恩:问题的第二部分正是现在的问题所在。所以这可能是我们自己缺乏想象力。但我们正在努力弄清楚 ChatGPT 可以在我们的世界、这个制造业世界中的哪些地方应用。工厂车间的问题通常——现在,你提到了一个非常有趣的问题,试图找出涡轮机的故障。但通常情况下,我们在车间面临的问题不一定是知识图谱类型的问题。这是更多操作类型的问题。所以我们正在寻找。我们将继续寻找并继续监控。我一直在关注这些技术的发展,看看哪些技术可以适用于我们的世界。因此,希望我们可以在那里做一些事情。
我最近在一个贸易展上与一位先生进行了一次有趣的谈话。我们谈到了GPT的应用。他说,“好吧,如果 ChatGPT,基本上,它会采取行动或扮演医生的角色呢?那么如果它像专家维护人员一样呢?所以你可以问它你认为问题是什么?这里有这个特殊的设备?类似于你所说的。它可能会回来。它可以说,嗯,这些是五种不同的潜在事物。是的,也许。我的意思是,这是一个有趣的应用程序。但它需要很多领域知识可能不在它所训练的数据中。所以你将不得不扩充该数据源。
埃里克:是的,很酷。好吧,我想,对于我们双方来说,看到未来几年在这里发生的事情将是令人兴奋的。
布莱恩:当然。
埃里克:布莱恩,谢谢。我真的很感谢你今天的时间。
布莱恩:是的,谢谢你,埃里克。这很棒。