AI 应用数据泄露:甲方丢粒饭 乙方丢饭碗|算法|工业|AI

“乙方泄露数据是砸自己饭碗,而甲方最多掉颗饭粒 —— 你见过哪个快递员会为了个包裹砸自己饭碗的?谁傻啊!”

在谈到客户的数据安全问题时,蘑菇物联创始人兼CEO沈国辉 给牛透社打了两个贴切的比喻。

安全问题确实是行业通病,谈到数据安全,服务商比甲方紧张多了。

沈国辉坦言:“数据从甲方工厂设备里采出来,我们拿了他的数据,借个胆子也不敢乱来!真要是泄露了,我们公司直接就得关门大吉,赔都能赔到死无葬身之地。可甲方呢,数据泄露了可能算个工作失误,压根不是一码事。”

沈国辉说,蘑菇物联的护城河是算法、协议和数据,这三者缺一不可。

算法能力是他们赢得客户信任的基础,没有过硬的算法实力,客户根本不会给服务的机会;通讯协议是数据采集的前提条件,不连接设备,再好的产品也无法落地应用。

过去十年他们积累了超1600种设备通讯协议,"蘑菇物联连不上的设备,别人也连不上"。

最后才是数据积累。目前,他们日均处理超过100GB的工业数据,这相当于5 万本百万字书籍的总量,约等于一座中小型图书馆的全部文字信息。这些数据都要经过严格的处理流程,从数据清洗到数据标准化,再到提取有价值的工业特征,形成了独特的数据优势。即使在当前市场环境下,蘑菇物联依然保持增长。

最近几年,沈国辉发现市场上发生了一些变化,客户的预算变了,需求也变了。

更重要的是,市场出现了 “劣币驱逐良币” 的现象,部分厂商为了迎合客户的短期回报要求,在合同中乱承诺、夸海口,最终在项目验收时却不了了之,导致项目烂尾。

他看不惯这种现象,对此很无奈。

【 以下为牛透社本次访谈内容 】

牛透社:蘑菇物联早期选择从工业设备智能化切入,当前工业AI领域最值得破局的黄金场景是什么?聊聊你的判断逻辑。

沈国辉:工业AI的价值场景,我认为可以分三个层次:

首先,最优的场景是能直接帮客户拿订单、创造收入,这才是真正能让制造业客户眼前一亮的;其次,是能创造可量化、可测量的降本价值,比如省电省人,要能实实在在装电表测出来,或者明确计算出节省了多少人力;最后,才是常见的提效提质,虽然也有价值,但说服力相对弱一些。

简单来说,制造业最关心的就是四个关键词:增收、降本、提效、提质。其中增收是最难的,但价值也最大。

目前来看,第二层次的可验证、可量化的降本效果,是客户最愿意买单的价值点。

牛透社:在工业AI领域,既有传统工业软件巨头也有新兴AI公司,蘑菇物联的差异化壁垒是什么?

沈国辉:我们的护城河可以总结为三个核心要素:算法、协议和数据。这三者形成了一个闭环,缺一不可。

首先是算法能力。这是我们赢得客户信任的基础,没有过硬的算法实力,客户根本不会给我们服务的机会。

很多人以为工业AI就是大模型,但我们的算法远不止于此。如果只用大模型,那根本形不成壁垒 —— 大模型谁都能用,甲方也能用。我们的独特之处在于将大模型与传统AI技术,比如强化学习、马尔科夫过程、傅里叶变换、随机森林、决策树等深度融合。

大语言模型擅长处理文字和逻辑推理,但对工业设备的时序数据处理效率不高,甚至会产生 "幻觉"。而我们结合传统算法,能更高效地处理设备数据。

其次是设备通讯协议。这是数据采集的前提条件,如果连设备都连接不上,再先进的算法也无法落地应用。

我们专注高耗能通用设备,比如空压机、中央空调,这类设备有两个特点:能耗高(节能需求强)、通用性强(市场空间大)。过去十年,我们积累了超1600种设备通讯协议,协议问题对别的公司来说绝对是巨大的障碍,但我们手到擒来,这是实打实的门槛。

现在业内有个说法,"蘑菇物联连不上的设备,别人也连不上",这就是我们的价值。

最后才是数据积累。通过实际服务客户,我们才能获得真实场景下的设备运行数据。

目前,我们日均处理超过100GB的工业数据,这些数据都要经过严格的三步处理流程:第一步是数据清洗,去除传感器噪声和异常值;第二步是数据标准化,转换成可分析的统一格式;第三步是特征工程,提取有价值的工业特征。

这个闭环体系让我们形成了独特的数据优势。即使在当前市场环境下,我们依然保持增长。

牛透社:从设备监控到预测性维护、能效优化,蘑菇物联的产品迭代反映了工业客户需求的哪些变化?

沈国辉:这个问题很好。

让我用一个生活中的例子来说明:就像我们买智能手表,有人是为了测心率,有人是为了计步数,还有人就是为了好看。

设备监控也是同样的道理。

最初,客户的需求很简单,就是想随时知道设备是否在正常运转。这就像给设备装了个 "健康手环"。

但随着发展,客户发现仅仅知道 "设备现在好不好" 是不够的,他们更想知道 "设备什么时候会坏"。这就是预测性维护的价值所在。

以空压机为例,突然停机可能导致整条生产线瘫痪,损失可能高达上百万。通过AI分析设备数据,我们可以提前预警潜在故障,让客户有时间安排维护,避免非计划停机。

现在,客户的需求又升级了,不仅要设备不坏,还要运行得更高效。就像我们不仅希望手表能测心率,还希望它能给出健康建议一样。能效优化就是在保证设备可靠性的前提下,帮助客户节省能耗成本。

这个发展过程,本质上是从 "事后处理" 到 "事前预防",再到 "主动优化" 的升级。每一步都对应着客户痛点的深化和需求的升级。

预测性维护主要依靠传感器监测数据,通过算法预测故障,这属于被动防御。而能效优化则需要主动控制设备运行参数,实现更高效的能源使用。

这一发展路径与行业特点密切相关。

2009年 "感知中国" 战略催生了一批做设备监测的公司,他们主要解决 "设备会不会坏" 的问题。但空压机、中央空调这些高耗能设备占工厂能耗的40%~60%,客户更需要解决 "怎么更省电" 的问题。

我们之所以选择专注于高耗能通用设备领域,主要基于三个关键维度的考量。

首先是通用性。这类设备的应用场景极为广泛,渗透在多个行业的生产运营环节中,由此催生了庞大的市场规模,为我们的业务拓展提供了广阔空间。

其次是高能耗特性。正因为能耗基数大,所以蕴含着巨大的节能潜力,客户对于通过技术手段降低能耗、削减成本的需求迫切,付费意愿也相对较强。

再者是控制需求。这类设备在运行过程中,往往需要对各项运行参数进行实时、精准的调节,以保障其高效稳定运转,这也为我们的技术介入提供了重要切入点。

以电子行业为例,我们通过优化空压机群控策略,成功帮助客户实现了15%~20% 的能耗节省。这种节能效果是完全可测量、可验证的。

牛透社:在当前经济环境下,工业客户普遍面临经营压力,你们在市场上感受到了哪些变化?

沈国辉:第一,关于客户预算的变化。现在的工业客户就像手里攥着5000块钱却只敢花1000块的消费者,极度谨慎。投资回报周期要求从原来的3年~4年 缩短到2 年以内。他们对 "增收" 类项目持观望态度,更看重 "降本",更倾向于可量化的节能项目,而非模糊的效率提升。

第二,客户的需求也在变。现在客户最愿意买单的是 "看得见、算得清" 的价值,比如要有精确到度的节能效果,要具备可验证的故障预测能力,还要能够节省人力。

第三,市场出现了劣币驱逐良币的现象。部分厂商为了迎合客户的短期回报要求,在合同中乱承诺、夸海口,最终在项目验收时却不了了之,导致项目烂尾。

但我们蘑菇物联坚持三个底线原则:一是所有数据真实可追溯,二是效果必须经得起第三方验证,三是不承诺超出技术能力范围的回报。

牛透社:你们目前标准化SaaS与定制化解决方案的营收占比如何?客户更倾向于哪种模式?

沈国辉:我们标准化SaaS的占比很高,达到80% 以上,定制化解决方案仅占一小部分。

标准化SaaS主要面向多数客户的共性需求,通过SaaS化部署快速落地;而部分大型客户会有私有化部署需求,这类项目会涉及少量定制化开发。

相比之下,专注高耗能通用设备的特性,让我们能以标准化产品覆盖大部分场景。

如果做专用设备的数字化,同行往往不得不依赖私有化部署,大概率会沦为定制化解决方案,而我们通过聚焦通用设备场景,避免了这种困境。

牛透社:工业设备故障样本通常较少,蘑菇物联如何用少量数据训练出高精度模型?会采用迁移学习或合成数据技术吗?

沈国辉:核心在于数据治理。

无论是大模型还是小模型,数据质量直接决定精度。数据治理不到位、结构混乱,模型就容易出 “幻觉”,优化效果也会大打折扣。

我们的路径很清晰,先通过物联采集数据,然后过滤掉传感器产生的噪点和毛刺数据,完成清洗;再将数据结构化,完善治理形成数据集;最后用高质量数据集训练模型,不断迭代提升精度。

物联数据量极大,人工清洗不现实,必须靠算法自动化处理,这本身就是技术门槛。

打个比方,数据就像石油,纯度不够的油会让发动机抖动,而经过治理的 “纯正数据” 才能为模型提供持续动力。

只有把数据基础打牢,模型精度才有保障。

牛透社:设备数据存储在你们这儿,客户怎么看数据的安全性问题?你们又凭什么保证安全?

沈国辉:工业AI与智能驾驶类似,均采用云边端架构,核心是根据功能需求分配算力与存储资源:

云端主要承担需要大存储、大算力的任务,比如模型的训练、迭代。云端能利用其存储和算力优势,处理海量数据并优化模型,就像特斯拉将摄像头采集的大量数据放在云端训练,不断提升算法能力。

边缘端部署的是经过 “蒸馏” 的训练好的模型,负责实时计算与控制。边缘服务器直接安装在空压站、中央空调机房等能源站房内,与设备仅相距几米到十几米,能实现毫秒级响应,满足实时性需求。

我们的决策标准是,需实时处理、强调及时反应与独立运行的任务,比如设备控制,必须放在边缘端,避免依赖无线络。

我们把大存储、模型训练与迭代的任务,放在云端。边缘端与云端每小时同步一次数据即可,模型迭代时通过OTA远程升级从云端推送至边缘端,类似特斯拉车机系统的更新逻辑。

安全问题确实是行业通病。但数据是从甲方工厂设备里采出来的,设备是他的,数据自然也是他的。

我们拿了他的数据,敢乱来?借个胆子也不敢!真要是泄露了,我们公司直接就得关门大吉,赔都能赔到死无葬身之地。可甲方呢,数据泄露了可能算作工作失误,压根不是一码事。

我们比甲方紧张多了。

我们拿数据是当石油来加工的,是帮他创造价值的,又不是拿去卖钱。真能卖钱这生意倒好做了,可甲方能答应吗?

甲方真没必要担心,真想放心,签协议,加惩罚条款,怎么罚都行,规矩我们认。

乙方泄露数据是砸自己饭碗,甲方最多掉颗饭粒 —— 你见过哪个快递员会为了个包裹砸自己饭碗的?谁傻啊!

牛透社:能否分享一个蘑菇物联AI产品在工业行业实际应用的案例,讲讲它是如何解决企业实际问题的?

沈国辉:就说德福,它是铜箔行业的龙头企业。生产铜箔,需要空压机、中央空调、水泵这些通用工业设备,保障水电气冷热供应。

但问题来了,这些高耗能设备管理起来太复杂了,涉及空气动力学、机械制造、电气工程自动化、暖通工程、热能与动力工程好几个学科。

大学里都没哪个专业能把这些全教了,招人都难,想找能同时管好这么多设备的人才,难上加难。而且设备多了,能耗也跟着飙升,这可是笔大开销。

这不就正好是工业AI能发挥作用的地方吗?

我们做的就是把 “老师傅” 软件化,变成数字人。我们的 “云智控” 产品,就相当于一个训练有素的老师傅分身,不仅懂刚才说的那五大专业,连语数外、数理化这些基础学科知识也都掌握,是大模型结合小模型训练出来的。

德福买的就是这个 “数字老师傅”。它产能扩张期,既要保证生产不能掉链子,又得降能耗,还缺设备管理的人手,我们这产品全给解决了。既能节能,又能帮着省人,还不耽误生产。现在测下来节能效果有超过15%。

牛透社:你们最常遇到的客户认知误区是什么?

沈国辉:最典型的就是客户过度自信,用老外的话说叫 “OC(Over Confidential)”。

他们太相信自己那套老经验了,觉得 “我干这行十几年,参数都是手调的,你一个软件能比我强?”

这其实是对过往经验的过度自信,形成了路径依赖。

他们一开始就对你的POC做 “有罪推定”,先认定你不行,然后到处找理由证明自己是对的。

说白了,想挑刺还不容易?就像有人会直接怼 “你又不是干这个的,你懂还是我懂?”

但他们忘了,现在的AI真可能比他懂,只是很多人不愿意承认。

牛透社:你曾提到要在 “一厘米宽的地方挖一公里深”,坚持深耕垂直领域。那为什么不拓展更广泛的业务领域?进入新行业时,又如何快速适配差异化的设备协议和工艺逻辑呢?

沈国辉:我们就是要在窄领域做深做透,让客户看到我们的工业AI软件,比如云智控,就是比最有经验的老师傅还靠谱。

做工业得有敬畏心,现在在这 “一公尺宽” 的领域里,都还有人天天挑刺、想证明我们错了,要是贪多求广,那不就被批得体无完肤了?

至于进入新行业时适配设备协议和工艺逻辑,没别的捷径,全靠一点点啃那些脏活累活。

朱啸虎也说过,工业领域,把脏活累活干扎实了,自然就有了护城河。光靠算法耍花架子,根本成不了事。

这就像毛竹生长,前四年在地下默默扎根,看起来没动静,可根扎够深了,一旦破土,就能蹭蹭往上长。

我们蘑菇物联快十年了,现在就像刚冒头的毛竹,碰上行业环境不好,时代的尘埃一层层压上来,更得把根扎稳、把脏活累活干透,才能不管多少土压着,都能顶破出来。

我们已经在做出海的事情,东南亚的越南、泰国、马来西亚,还有日韩这些地方都在推进,先从近距离的市场开始布局。目前这些国家都已经有POC概念验证项目了。

牛透社:蘑菇物联推进AI商业化的过程中,面临哪些主要挑战?

沈国辉: 我们主要面临三大挑战:

一是客户认知与信任问题。部分客户过度依赖传统经验,对AI技术缺乏认可,认为手动调整参数比软件更可靠。针对这一问题,我们采取筛选客户的策略,优先与愿意尊重专业分工的客户合作,同时借助媒体力量提升行业认知,推动客户接受专业化的AI解决方案。

二是预算约束。当前工业企业普遍面临资金压力,对AI投入的回报周期要求更为严格,回本周期从过去的三年缩短至两年以内。尽管短期困难,但我们坚信制造业作为中国的经济支柱,长期来看市场必将回暖。

三是数科公司对的行业冲击。大量数科公司以 “包工头” 模式运作,将研发外包给技术公司并获取利润,导致真正投入创新的企业利润缩减、研发受限。我们认为这种模式不可持续,未来行业将逐步回归良性生态。

注:文/Alex,文章来源:牛透社(公众号ID:Neuters ),本文为作者独立观点,不代表亿邦动力立场。

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender