大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。IBM提出大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
工业大数据是大数据与智能制造的交叉点。工业大数据是指在工业产品全生命周期的信息化应用中所产生的数据,是工业互联网的核心,是工业智能化发展的关键。工业大数据是基于网络互联和大数据技术,贯穿于工业的设计、工艺、生产、管理、服务等各个环节,使工业系统具备描述、诊断、预测、决策、控制等智能化功能的模式和结果。
一、工业大数据来源
我们所谈的工业大数据,不完全等同于企业信息化软件中流淌的数据,从业界的共识看,主要来源有三类,
第一类是企业经营相关的业务数据,这类数据来自企业信息化范畴,包括企业资源计划(ERP)、产品生命周期管理(PLM)、供应链管理(SCM)、客户关系管理(CRM)和环境管理系统(EMS)等,此类数据是工业企业传统的数据资产。
第二类是机器设备互联数据,主要是指工业生产过程中,装备、物料及产品加工过程的工况状态、环境参数等运营情况数据,通过MES系统实时传递,目前在智能装备大量应用的情况下,此类数据量增长最快。
第三类是企业外部数据,这包括了工业企业产品售出之后的使用、运营情况的数据,同时还包括了大量客户、供应商、互联网等数据状态。
在工业企业生产制造产品的过程中,通过数据采集和分析,可以提供信息决策支持,在产品的生产流程、上游供应链、产品质量、生产管理控制、研发设计、下游供应链、远程维修维护等环节起到重要作用。
二、工业大数据的特点
工业大数据和互联网大数据采集和运用的目的不同,导致工业大数据与互联网大数据有很大的不同,具体体现在以下几个方面:
1、工业大数据更强调数据的完整性
互联网大数据是在数据分析的基础之上,分析用户的使用习惯、消费偏好和行为特征等相关数据,运用的是统计学的知识,对数据进行处理,如今日头条,通过数据的分析,给用户推荐阅读内容,增加用户的粘性。如淘宝,通过统计分析根据消费者的消费习惯,推荐相关的产品给用户。而工业大数据是通过对设备、机组等连续记载,根据设备的运行的全部数据,根据对设备的监测,在多指标的逻辑算法之上,基于数据分析的综合评估,来指导设备的调整、检修、配件的更换、耗材的更换保证生产的连续性。
2、工业大数据更强调数据的准确性
互联网的大数据所收集的数据,大多是关联性的挖掘,是一种发散性的数据收集和分析,互联网大数据在进行预测和决策时,仅仅考虑的是两个属性之间的关联是否具有统计显著性。如亚马逊收集买家的行为,对转化率、相关性、买家满意率和留存率数据进行分析,类似这样的数据并不能准确的反映每个买家的购买行为的决定因素。
而工业大数据具有非常强的目的性,更强调数据的正确性。工业大数据对预测和分析结果的容错率远远比互联网大数据低的多。如工业互联网中的故障预测是基于装备真实健康状态和衰退趋势,结合用户决策活动的定制化需求,提供设备使用、维修和管理等活动相关的最优决策支持,并达成任务活动与设备状态的最佳匹配,以保障生产系统的持续稳定运行能力。有的工业企业需要设备“近零故障”运行,否则会带来巨大的损失。
3、工业大数据更强调数据的及时性
互联网大数据在时效性方面没有特殊的要求,其数据是长期积累,从中找出数据中的相关性即可。而工业大数据就更着重数据的时效性了。如工业设备的故障,厂房或生产的灾难性的故障,火灾、污染物的泄露等,这些不仅仅需要事后的补救,更为重要的是,工业互联网需要在数据提供和采集的基础之上能给予提前预测,发出预警,在灾难发生之前采取措施避免灾难的发生。
近年来由于大数据被用于生活和工作的方方面面,甚至有人曾说未来的时代将不是IT时代,而是大数据的时代。大数据是重要,但却也出现信息越多,就越靠近真相这样的认知,这就不应该了。《The Signal and the Noise》(信号与噪声,作者Nate Silver),这本书里面有一个观点:更多的数据意味着更多的噪声。信号是真相,噪声却使我们离真相越来越远。
所以,无论是互联网大数据还是工业互联网大数据,人们需要构建有效的算法和模型,去识别和认知何为真相,这样,大数据才真正给我们的生活和工作带来正面的影响。
欢迎转载,注明出处
欢迎关注微信公众号:物联研究 了解最新物联网科技资讯
也可扫描二维码,关注我们!