过去的一年时间,我们聊过一些工业互联网项目,之前也将几乎物联网平台项目看了一圈,加上跟之前投的工业物联网项目的讨论,对工业智能有一些思考,写下来,权当作为一个简单的总结。
工业智能是在现有的工业化和信息化基础之上,以「数据」为核心,将工业生产全生命周期中涉及的各个软硬件层面的数据,进行融合加工处理,在此基础上结合行业经验、knowhow等将工业知识通过算法、模型等方式进行封装、固化,用于解决工业生产过程中的问题,形成最优解决方案,提升工业能力,创造增量价值。
数据是工业智能的血液,离开了数据的工业智能如巧妇难为无米之炊。但工业数据的现状却也是制约工业智能发展的瓶颈。
1.工业数据从哪来?
工业数据大体可以分为三类:
一是来自于软件的生产类数据,即各种MES/ERP/PLM/SCM等软件中关于产品属性、工艺、生产、采购、订单、售后等数据;这些数据可以通过软件对接及集成的方式来获取,其数据质量相对较高,结构化较强,数据量不大,但具有极大的挖掘价值;
二是来自于设备的数据,包括各种生产设备在运转过程中的状态信息、制造参数、生产数据等,这类数据以非结构化数据为主,如设备工况(压力、温度、振动、应力等)、音视频、日志文本等数据。这类数据一般采集于设备的PLC、SCADA及外部安装的传感器。这类数据量大、采集频率高(一般在毫秒级)、实时性强、非结构化强。
三是其他数据,如能耗、用水、温度、环保等数据。
2.工业数据的问题
即便获得了工业数据,但这些工业数据远未到能使用的状态。工业数据的几个明显问题,使得工业数据的使用也具有较大的挑战。
首先,工业数据本质上是充满噪音的脏数据,必须经过大量的算法清洗,才能使用;
其次,工业数据的量太大。以高铁行业举例,一辆高铁有8-12个轴箱轴承,每个轴承2-3个振动传感器,每个轴承每秒采集的数据大约为130M,数据量巨大;
再次,数据所涉及的行业、场景各种各样;
第四,数据跨学科导致的关系十分复杂,工业领域的数据可能有机械、光、电、热、磁等各个学科领域。
3.工业大数据or工业小数据
尽管我们在上面说到,工业数据所涉及的数据量巨大,然而在实际的生产过程中,我们面临的却是“工业小数据”,甚至“工业无数据”的情况。
导致这种情况存在的原因是多方面的。其中,第一大原因当属过往数据的缺失。从某种意义上来说,工业生产过程中,过往更多依赖于经验与knowhow来形成对问题的判断和解决方案,缺乏采集数据、存储数据的理念,使得当需要数据来训练一个模型时,却往往需要从头积累。工业智能项目在实施过程中,往往由于缺乏历史的数据,需要重新采集数据,训练算法和模型,而使得整个工期大大延长,也使得合同双方的成本都大大提升。
即便过往有一些数据积累,然后由于目的的不同,所采集的数据类型、方向也存在较大的差异。在过往,数据的采集可能更多是为了做监控、控制,而在工业智能时代,数据采集的初级目的是监控和控制,而终极目的是为了分析、优化和建模。
从另外一个角度上来说,如果将工业智能要完成的目的拆分成一个个具体的问题或者任务,每一个工业APP或工业智能模型解决一个具体的问题,如果能厘清解决该问题的核心因素,有针对性的采集和获取数据,也许“工业小数据”也能达到良好的效果。
也就是说,如果笼统的看工业大数据,你会对各种类型、来源、存在形式的数据感觉到乱如大海,但细化到具体问题、具体场景来看,也许数据的问题便变得不那么困难。
4.如何快速低成本地获得高质量的工业数据
既然工业数据存在这么多问题,那么如何获得高质量的工业数据就变成一件十分重要的事情。
高质量的工业数据获取,离不开一套自上而下的完整的数据获取体系的建立。这套体系包含标准定义、有效的数据库、强大的PaaS支持,高效的数据整合、完整的协议解析以及低成本的采集终端五个方面。
低成本的采集终端:应用于各种场景及设备的低成本传感器;
完整的协议解析:数十种工业协议的打通是一件费时费力的苦活累活,虽然不难,却又苦又累、不得不做;
强大的PaaS支持:PaaS平台负责数据的管理、调用、资源管理、分析展示和安全管理等;
高效的数据库:工业数据涉及设备工况及传感器数据,这类数据频率高、量大,用传统关系型数据库处理,吞吐量大,处理速度慢、性能差。时序数据库的高压缩、高性能特点能有效解决上述问题;
完整的标准定义及数据整合:统一的主数据管理,建立数据标准,制定统一的编码、结构、流转方式和属性,确保数据的一致性;逐步积累行业知识库、合适的算法组建及相关机理模型。
5. 工业数据智能的层次:从数据展示到数据智能
我们认为,在实践过程中,工业数据智能至少分为两个层次:一是数据可视化,二是数据智能。
初级层次:数据可视化。即将所获得的各种数据以各种报表及图形形式进行统计和展示,而由人通过过往的经验与知识来进行判断、决策和优化。
高级层次:数据智能。即在数据统计分析的基础上,结合行业经验、知识、机理形成自动化的决策和优化能力。
任何一个做智能化转型的行业,采用数据驱动的方式,最终目的都是要将人的决策过程自动化。也就是说,我们所理解的数据驱动的工业智能,是要将以前要靠人去将不同系统里的数据进行整合信息、内化成知识、最后形成决策的过程,完全变成自动化的过程。
显而易见,高级层次的数据智能是工业智能所追求的真正的目标,而数据可视化只是工业智能的一个过程。
然而,现实中,存在大量公司美其名曰工业智能、工业互联网,其主要的作用和价值还是在于数据分析和可视化上,远没有到数据智能阶段。
而之所以还停留在数据可视化,不得不说,相当一部分企业,尤其是国企、政府部门的所谓工业云、工业智能项目的主要目的是为了向领导汇报,而不是真正的用于生产实践。
当然,我们并不是说数据可视化不重要,恰恰相反的是,数据可视化是数据智能的必经阶段。
6. 数据模型化的四象限
如上文所述,数据智能的终极目标是实现以数据驱动的决策自动化。工业智能建模,是实现决策自动化的方式。但并不是所有的场景和问题都适合通过建模来解决。基于数量的质量情况以及建模对象的机理性,形成了四象限。
数据少,机理性弱(或对建模对象理解不够深时):更多依赖于经验进行人为的判断,难以通过建模老实现智能化;
数据少,机理性强:可以基于机理来做分析,基于规则建立模型来做到诊断和预警,例如典型旋转类设备的智能诊断和预测性维护;
机理性弱,数据多:前期以经验为主,训练模型,发挥数据驱动的模型优势,提升对机理认知;
数据多,机理性强:适合做机理跟数据融合的模型,模型的可解释性更强,准确性高,对于外部环境的变化也更加不敏感。数据模型可以基于数据做自动决策和分析。
通过上述分析,我们可以看到,在未来数据智能模型与人的经验将有所侧重、有所分工,专家经验在那些数据量小、机理性弱的场景依然存在巨大的价值;而数据智能模型则适用于那些数量大、机理性强的场景。
7.基于数据智能,我们可以做哪些应用?
举例1:设备的预测性维护
比如风力发电机的运转动作相对单一,机理性较强,数据的获取相对较容易。可以基于数据模型来分析风力发电机的运转健康状态,如是否有裂缝、损耗等。
举例2:优化能效
流程工业相对自动化程度高,数据质量高,对于工艺环节的每一个优化,都有助于提升效率、降低成本和能耗,比如在炼钢过程中,通过数据的采集与分析,可以设定在不同阶段的温度,从而控制好进煤量、空气输入量等,从而能有效提高能效。
举例3:计划排产
C2M是未来工业生产的重要目标。从工厂计划排产的角度来看,目标是实现当时当地的产能最优,约束条件是企业的产线设备、人员、产品属性、供应链数据等,通过历史数据的学习和训练,不难形成一个较好的预测模型。这一模型能根据产线和工厂的实时数据动态分析,动态调整,以帮助企业实现准确把控,最大化经济效益。