上周工信部指出,随着信息技术的发展,数据已成为国家基础性战略资源,成为拉动技术进步和产业发展的强大引擎,也必将催生数字经济时代的到来。可以看出,大数据应用成为争抢布局的下一个链条。
然而不论对于哪一个领域来讲,数据收集才是平台应用的基础。尤其在车联网领域更是如此,如今各界巨头及车企更是纷纷投身其中。但由于各家数据采集规范各不相同,并且对于数据项的定义没有统一标准,现实情况是,很多采集到的数据无法直接产生价值,后期改造周期较长,数据维护成本高,造成资源浪费,也无法满足用户需求。于是业内有声音发出,是否需要制定统一的行业数据采集标准?
如何定义数据标准?
12月2日,前装车联网大数据服务运营商彩虹无线联合上汽、广汽、江铃、奇瑞、众泰、博世、德赛西威等22家汽车厂商及车联网软硬件服务商,共同推出了首个前装车联网数据采集标准。
在标准正式发布当天上午,车云受邀参加该标准研讨会,其中上汽、广汽、东风日产、长安汽车、江铃汽车、猎豹汽车、中国人保、太平洋保险、国寿财险、中华联合财险、大地财险、安心财险、瑞士再保险、中国汽车技术研究中心、北京大学商务智能研究中心等70多家企业相关人员就数据标准及应用价值展开讨论。
具体来讲该标准是通过一个文件来规范数据采集的内容和频率,统一定义数据上的编码和描述,统一定义数据上的单位和精度,基于十万辆车两年的数据周期进行模型的验证和应用,基于30多家车厂和保险公司的意见,归纳总结135个数据项,并进行了统一的编码。
首先,采集标准包括数据精度和周期频率,其中彩虹无线把数据采集周期分为两类,一个是周期性采集,在运行过程当中按照一定的周期循环进行采集;第二个实际出发采集,只有当一个特定事件发生的时候出发采集的事件,比如说车辆点火时的状态。
其次,在数据质量上我们知道,大数据的运营和服务基础在于建立相关数据的业务模型,而数据业务模型最根本的是数据质量。数据质量又包括两个方面,一个是数据采集类别,另一个是数据精度,因而运用在不同的领域和场景下的数据对质量要求不同。
举个例子,目前很多保险公司在做UBI的产品定价,而大多数保险公司对这个产品的模型基础是驾驶安全模型,这里面的数据又包括高频的急刹车、循环变道,这些行为是转瞬即逝的,要求数据采集至少需要一秒钟一次的频率,才能够准确的分析出以上的驾驶行为。而如果前期车联网建设过程中对于T-BOX数据采集的规范,没有严格的定义,那么在精度就会存在不足,则意味着数据对于保险产品的定价缺乏指导性。
彩虹无线创始人兼CEO黄亮说:“谈大数据,脱开应用其实是没有着力点的,而应用模型必然是建立在与其业务模型相匹配的数据上的。从源头讲,也是依托高质量的数据。”
车云菌认为,彩虹无线制定的前装车联网数据的采集标准核心在于数据质量,基于模型推倒出所需数据项,比如车速,经纬度,持续油耗等等,然后再多维度制定可以达到的数据精度要求,比如GDP达到8位或者车速要以每秒为单位,来重新定义数据的标准化。
彩虹无线祁超以如何判断是否频繁变道来举例解释,彩虹无线需要采集
1、用户的精度和纬度,同时使用低频段的GPS采集频率;
2、采集车速和方向盘的转速来判断是否频繁转弯;
3、采集车速加速度的判断车辆是否在高速的行驶等等。
另一方面,彩虹无线对前装车联网大数据收集的优势在于,已与18家整车厂商达成数据运营合作,同时与上汽、众泰等5家整车厂商正在做技术及产品对接,预计会在接下来的几个月内陆续上线。此外与上海安吉星的第一期试点工作已经完成。
如何应用数据模型?
基于整合高精度数据,构建应用模型之上,彩虹无线将这套标准主要应用在两个方面,一个是基于保险创新的立方体计划,另一个是基于整车厂业务优化的数据智能服务。
今年6月2号,彩虹无线将公司的战略定位为前装车辆大数据的服务运营商,两条业务线是基于保险创新立方体计划以及创新和优化的车厂数据智能服务,可以看出,无论是公司的定位还是业务线的选择都是基于数据深度的挖掘与应用,此次发布的带有行业性质的数据采集标准也在总体战略布局当中。
据悉,在保险创新领域,彩虹无线构建了驾驶安全评级模型、UBI定价模型、碰撞识别模型、理赔反欺诈模型等。基于价值行为进行个性化差异化的策略,使风险价值与实际的风险相匹配,比如说主动报案,反欺诈等等的一系列的应用。
在车厂数据智能应用方面,彩虹无线叠加现有的CIM、DMS数据,构建零配件质量分析模型、整车性能评估模型、故障预警模型、客户生命周期分析模型。试图为车厂整个的研发生产和售后的环节提供一个决策支持的依据,降低研发成本。
值得注意的是,为了得到更多车企厂商及车联网产业链上相关企业的资源对接和认可,黄亮放了狠话:“凡使用该标准采集的数据,彩虹愿意承担一定的数据流量成本”。