管理 学习应用最佳实践并优化您的操作。

为什么工业物联网项目需要工业物联网专用数据库

工业4.0创造了无数机会,如预测机器分析、计算机视觉、无人驾驶卡车和具有增强现实功能的工业可穿戴设备,使组织变得更高效。这些用例有一个共同点:它们都需要收集、处理、存储和分析大量数据,以推动数据驱动的决策。

让组织能够以可扩展、高性能和高效的方式从如此庞大的数据中提取价值,正是工业物联网的承诺所在。鉴于数据的这种核心作用,数据库技术是实现工业物联网好处所必需的数字转型的核心。

不幸的是,超过70%的物联网项目失败由于缺乏必要的技能和实施有效的生产数据基础设施的技术挑战。工业组织现在有一个共同的目标,即通过云实时优化他们的流程,以及将他们的传统基础设施转变为合适的数据库策略。

为什么工业物联网数据是一个挑战

工业物联网数据的规模和形状与传统数据和网络规模的数据非常不同。这在很大程度上是因为涉及到大量的数据源和端点。传统的数据库和基础设施技术根本不打算在工业物联网规模下处理大量的机器数据。

为了更好地了解工业物联网的规模,想象一个工厂有成千上万的传感器积极收集来自一万种不同类型传感器的数据。现在想象一个组织在世界各地经营着100家这样的工厂,以及每一条供应链。工业物联网数据库实现的任务不仅是收集这些庞大的传感器数据量,而且还要提供高效的性能,并实现亚秒级的实时数据分析。

另一个问题是工业物联网数据的多样性。IIoT传感器数据通常存储为一个嵌套的JSON文档。还有关系数据,如文章和产品信息、批处理信息、拓扑和固件,这些数据必须与传感器数据关联并上下文化才能有意义。

此外,工业物联网还生成带有时间戳的全文时间序列数据,用于跟踪过程,地理空间数据用于协调移动设备的数据点,图像数据用于验证产品状况,以及其他多媒体BLOB数据。随着产业组织规模的扩大,这样庞大的数据范围必须易于管理。更重要的是,组织必须能够使用单个数据库而不是协调多个数据库来保持这种简单性。

传统数据库不适合工业物联网

试图将带有为非工业物联网用例构建的遗留架构的传统数据库应用于工业物联网转换的组织很快发现了它们的缺点。更具体地说,传统的SQL数据库(如Oracle和MySQL)伸缩性昂贵,而且没有为工业物联网用例固有的高数据量和查询复杂性做好准备。

开发人员经常发现传统的NoSQL和NewSQL数据库比如MongoDB和Apache Cassandra,因为它们很容易上手。然而,它们最终需要专业的工程师和复杂的管理,导致高昂的人员成本。与此同时,绝大多数工业工程栈都是sql连接的,这使得这些NoSQL和NewSQL解决方案很难与现有工具集成和适应。最后,这些数据库选项并没有针对工业物联网工作负载进行性能优化。

此外,时间序列数据库(如InfluxDB和Timescale)也可能出现不足,因为它们没有完全分布式架构的特性。例如,连接、子选择和聚合查询不是以完全分布式的方式实现的。这使得水平扩展计算能力以满足这些需求变得困难。可以轻松地存储数据和制作时间序列图表,但它们不是为运行高并发工作负载而构建的。

可以调用IIoT工作负载来处理每个节点的数千个连接。例如,运行交互式仪表板,同时对系统进行写操作,所有操作都在沉重的负载下进行。由于工业环境中的数据量大、速度快,数据库必须处理多个时间序列查询每秒,这比标准时间序列数据库的顶级查询速度快得多。

时间序列数据库也缺乏处理动态模式所需的灵活性,必须在另一方面运行额外的数据库来实现标准的工业物联网用例。此外,传统物联网数据库架构不支持工业物联网的规模,与其他时间序列工作负载相比,工业物联网的规模和复杂性通常更大。

工业物联网部署需要建立一个用于工业物联网特定参数的数据库

工业物联网需要无限的可扩展性,因为工业物联网解决方案可以轻松达到tb甚至pb级的数据。数据库不仅必须处理该卷,还必须满足计算端的性能需求。存储和计算的可伸缩性必须像添加新节点一样简单。

此外,数据库必须是一个通用的数据模型,能够存储工业物联网所需的所有不同类型的数据。它还必须支持大量和高度并发的工作负载,以及一个动态架构,使组织能够在运行时添加列,而无需重新标记或重放数据。

最后,数据库必须提供对混合云和内部部署的支持。工厂需要实时做出关键决策,并在没有可靠的互联网连接或不需要云连接的情况下进行分析。

工业物联网的成功取决于效率

工业物联网部署必须易于集成和操作,同时从一个总拥有成本(TCO)的观点。例如,一个文档数据库可能需要8个节点以可接受的速度运行IIoT用例,还有一个SQL数据库。相比之下,有意为工业物联网创建的数据库可以单独处理相同的用例,并且只有三个节点,从而提供了效率的变革性提高。

效率还意味着能够扩展访问工业物联网部署的最终用户数量。例如,当组织看到利用交互式仪表板的结果和机会时,他们可能会迅速扩大使用它们的员工数量。这对于计算需求来说是一个巨大的增长,但是这种扩展必须是简单的并且是可以承受的。

此外,效率是根据操作数据库所需的技能来衡量开发人员的生产力的。高效的工业物联网数据库解决方案是任何开发人员都可以开箱即用的解决方案,并且在将其作为分布式引擎运行时具有较低的复杂性。理想情况下,数据库运行时几乎不需要维护和监督,也不需要专门的DevOps人员。

当行业组织实现专为工业物联网构建的数据库时,结果是惊人的:TCO降低70%是完全有可能的,同时性能提高100倍,并具有多pb级的潜力。

数据库世界正在发展,现在组织为特定用例利用特定的、有目标的和战术的数据库解决方案变得更加普遍。对于工业物联网部署,利用工业物联网特定的数据库解决方案是成功的必要条件,而且比尝试使用错误的工具来完成任务容易得多。

所有物联网议程网络贡献者对其帖子的内容和准确性负责。观点是作者的,并不一定传达物联网议程的思想。

搜索首席信息官
搜索安全
搜索网络
搜索数据中心
搜索数据管理
关闭