在近期推进数字化项目的过程中,无论是与客户沟通还是审视技术方案,都注意到一个曾经备受瞩目的概念——“大数据”(Big Data)——似乎不再频繁出现。
这个概念曾是数字化转型初期的驱动力,激发了人们对数据潜在价值的无限遐想。在数据领域,“越多越好”几乎成为了一条铁律。暂且不论“啤酒与尿布”这一经典案例,单是5V(Volume, Velocity, Variety, Veracity, Value)这一概念,就已经成为无数数字化企业的坚定信条。
因此,许多技术创业公司纷纷投身于收集和开发海量数据,大规模投资于算力中心、存储中心和监测平台的建设。然而,在实际操作中,人们发现大数据的实际价值远未达到预期,就像互联网早期一样,人们满怀希望却不知如何实现价值转化。单纯追求数据规模,并不能保证获得更多的实际利益。
同时,由于数据质量参差不齐,与业务的相关性差,导致了“大浪淘沙”的数据分析模式,耗费了大量的人力和物力。尽管“大数据中蕴含着跨业务、跨场景的用户商业洞察,有助于精准决策和业务创新”是大数据精神的核心,但实际操作起来却颇具挑战。大多数企业仅掌握供应链中的一个环节,难以实现跨领域的关联。
若想通过整合不同厂商的数据资源来开拓新场景,数据服务成本和相关商务成本都不可小觑。例如,在支付行业,银行交易数据与消费侧数据若要实现业务与财务的整合,需要服务商、商户和支付机构多方协调,业务推进极为困难。
因此,大数据的实践路径通常只适用于互联网原生企业,因为这些企业能更容易地从平台侧向供应链两端辐射。从数据量的角度来看,平台侧拥有更庞大的数据量,在数据融合需求的博弈中拥有更强的话语权。相反,对于大多数企业而言,它们并非平台型企业,要么只负责生产,要么只负责销售,实现跨域大数据场景既缺乏专业能力,也缺乏资金保障。
目前,还有一种基于开源大数据进行“数据场景”强化的思路,但后来也被证明行不通,或者说“投入产出比”并不理想。开源大数据的数据质量低,与业务的相关性差,导致单位数据投入产出的业务价值有限——数据价值密度低。尽管学术界对开源大数据的建模和分析持续热衷,营造了一种开源数据价值更高的假象,但主要原因是难以获取产业数据。
在这种情况下,更多的传统企业开始反思,应专注于深化和透彻地挖掘现有数据,而不是单纯追求数据规模的扩大。如果大数据不能带来直接有效的价值,那么对企业而言,它可能成为负债而非资产。
基于上述讨论,并不是说大数据不重要,而是它并不适合每个数字化企业对数据资产的投资。数据获取渠道、已有数据与所需数据的比例、数据治理效率和开发效率,都是需要慎重考虑的决策因素。与其盲目拓展新的数据,探索难以验证的未知规律,不如在现有的业务架构中整理、加工和治理现有的数据资源,先满足当前的业务需求。
换言之,大数据是数字化企业发展到较高级阶段的任务。对于那些数字化基础尚不牢固的传统企业或中小企业而言,还是应以传统数据分析任务为中心,开展数据方面的工作。
发表评论 取消回复