文|數智前線 周享玥
編輯|趙艷秋
最近,IDC中國副總裁兼首席分析師武連峰在一場大會上分享了一項有意思的數據:他們在調研了全球800多個樣本、中國100個樣本后發現,在生成式AI應用這件事上,什么都還沒有做的中國企業只占7%,低于全球12.7%的占比。
這意味著,大量的中國企業已經在嘗試部署大模型和生成式AI。金融、教育、醫療、能源、汽車等各行各業都能見到企業探索大模型的身影。甚至連蒙牛,也在今年8月對外發布了業界首個營養健康領域模型MENGNIU.GPT。
而在諸多參與者中,涵蓋了能源、電力、化工、汽車、制造等細分行業的工業領域,也被認為是將被大模型帶來巨大變革的重要板塊。
工業場景有其特殊性,一方面它關乎國計民生,是經濟和產業發展的基本盤,2022年占GDP的比重達到33.2%。另一方面,這個領域極其復雜且細碎,目前國內規模以上工業企業數量超過40萬家,覆蓋41個工業大類、207個工業中類、666個工業小類,其中存在著大量的場景和業務痛點。
過去幾年,國內工業制造領域經歷了智能制造與AI1.0階段的洗禮,不少企業已對AI應用有了相當程度的認知,并完成了不少場景的智能化升級。而大模型的到來,正在為這個領域帶來新的機遇和挑戰。
01 拿錘子找釘子
年初大模型火了之后,最先興奮和行動起來的是在工業領域服務多年的各種智能化服務商。此前,在如何將AI更好地用在工業這件事,他們已經看了、想了好多年,但很多功能和暢想一直礙于技術限制,難以真正出來好的效果。
“相當于釘子一直在那兒放著,只不過是錘子行不行的問題?!敝泄せヂ摽萍技瘓F董事長智振告訴數智前線,大模型的出現,正好帶來了一把好用的 “錘子”,尤其是隨著多模態大模型的逐步推進,將有望把工業領域的應用場景完全打開。
業界的普遍共識是,AI大模型將會融入工業企業的研發設計、生產工藝、質量管理、運營控制、營銷服務、組織協同和經營管理等方方面面,極大加速這個領域的智能化升級進程。
市場機會也在迅速膨脹,有數據預測,綜合我國工業IT支出以及全球大模型增長水平,預計2026年我國工業大模型市場規模將超過5億美元,五年復合增長率達116%。
可以看到,面向工業這一重要市場,華為、百度、騰訊、阿里、微軟、谷歌等國內外大廠,都在加快大模型落地實踐。眾多科技公司也紛紛行動,中工互聯在今年6月推出了智工·工業大模型,智能制造企業思謀科技也在11月初推出了工業多模態大模型IndustryGPT V1.0。
早前就在工業數據等上面有著比較多積累的各大工業互聯網平臺,也幾乎都在探索與大模型的結合。海爾旗下的工業互聯網平臺卡奧斯,推出了以開源通用大模型為基礎的工業大模型COSMO-GPT??拼笥嶏w投資成立的羚羊工業互聯網平臺,也推出了由訊飛星火提供技術底座的羚羊工業大模型。
實際上,不少業內人士都看好大模型與工業互聯網的結合。北京信息化和工業化融合服務聯盟理事長閆同柱告訴數智前線,工業互聯網平臺下方有終端軟件,中間有操作系統,但還缺少一個大腦,大模型可以充當這個大腦。而工業互聯網平臺沉淀了大量人機料法環測的數據,也能反過來滿足大模型的大數據需求。
科大訊飛董事長劉慶峰分享的數據也證實了這種相互促進,在推出工業大模型后短短一個月零3天,羚羊工業互聯網平臺的用戶總量就增長了59%,平臺服務企業次數暴增88%。
供應端動作頻頻,需求方的態度和動作也在顯著變化。“上半年,大家都在觀望,主要是我們去找客戶?!钡较掳肽辏钦衩黠@發現,工業客戶的主動性在加強,許多企業開始主動找到他們,探討可能的場景,咨詢最新的功能和已經落地的案例集。
“工業客戶普遍會關注兩個問題,一個是以前人能做的工作,想讓大模型替代;一類是以前其他技術實現不了的,現在想讓大模型來實現?!敝钦裼^察,幾乎所有企業,都希望通過大模型實現降本增效,但也有部分企業是為了保持技術壁壘和先進性,而率先關注和應用大模型。
百度智能云資深人士也告訴數智前線,文心一言公測后,一大批央國企非常重視大模型技術的應用場景探索,其中也包括不少工業企業?!斑@些大客戶會拿一些原來自己難處理的場景,來跟我們探討,想用大模型去解決問題”,該人士說。
尤其是能源、電力等傳統行業,以及以汽車、新能源等為代表的高端制造業,由于本身對智能化有著更高的剛需,且資金相對充裕,在這波大模型熱潮中,反應最為迅速和積極。
比如在對安全生產需求極高的礦山領域,據知情人士告訴數智前線,礦山大模型幾乎已經成為落地最快的一個行業。百度、華為、騰訊等大廠都在這一領域有所實踐。
但除了一些跑在前頭的先鋒企業,工業制造板塊畢竟還是一個比較傳統的領域,行業里的企業普遍對新技術應用更謹慎,大部分仍然還處在觀望狀態。
閆同柱觀察,尤其是傳統制造業本身的數據量不是太大,大模型的門檻目前又相對較高,大模型到底能帶來多大價值,投入產出比如何,“他們還看不太清楚”,而這都會影響其在大模型上的投入進度。
02 “明年是應用爆發年”
工業領域各種細分場景眾多,不僅涉及研發設計、生產制造、售后運維等諸多環節,細碎且復雜,不同細分行業間,場景也有很大不同。隨著各家大廠與科技公司在大模型落地工業上的持續推進和探索,不少行業內企業已經開始梳理各種可能引入大模型能力的場景。
一位行業內人士坦言,部分企業最初對大模型應用的期望其實有些高估,但目前來看,大模型在制造業的應用落地,沒有想象得那么好,也沒有想象得那么差。
智振則告訴數智前線,過去半年間,他們接觸到了大量客戶反饋來的需求,有些客戶提出的需求會很細節,但當他們一步步拆解到技術層面后會發現,其中一些需求目前還比較難打通。
比如在前端的研發設計環節,有客戶向他們提出,希望用大模型實現將老圖紙轉化為3D圖紙的功能。但中工互聯實踐發現,目前用一張圖片自動轉化為3D游戲相對容易,但工業對精度要求非常高,要想用大模型將二維的CAD轉化為三維CAD,解決設計環節中重復性工作的問題,還比較困難,但一旦實現,“將帶來巨大變革”。
業內人士觀察,由于工藝機理復雜,研發設計環節普遍距離真正看見價值還有較多痛點待解,但一些簡單的功能目前已經可以實現。比如有企業將自己過往多年沉淀的方案庫與大模型進行結合,當客戶提出需求后,就能快速匹配方案庫里的方案。
實際上,在工業領域,最先將大模型用起來的,仍然是代碼生成、文檔整理、內部知識問答等最具普適性且相對外圍的場景。由于容錯率相對較高,且容易出效果,這也幾乎是所有行業在大模型應用上收獲戰果的首要陣地。
騰訊云智能制造首席專家邴金友介紹,在知識問答場景,他們幫一家汽車廠完成了汽車手冊的知識化,能讓大模型代替一部分銷售的工作;國內一家飛機制造廠也曾找到他們,提出將企業內部管理流程、管理辦法訓進大模型,實現了報銷申請等的自動化、智能化。
中工互聯也在智能問答、代碼生成等場景,實現了不錯的落地效果。智振透露,他們給企業做的專家系統,已經能達到90%以上的準確度,大模型寫成的代碼,能夠替代20%-30%的編程量。目前,智工·工業大模型已在能源、化工等領域落地近10個項目,覆蓋智能設備運維、工業網絡安全分析、智能質檢等多個場景。
除了前端的設計研發,后端的售后運維與內部管理等環節,一些廠商正也正在位于中間端的生產制造環節,探索利用大模型的生成能力,來幫助企業在工業場景中進行瑕疵檢測。思謀科技SmartMore聯合創始人劉樞舉例稱,在工業場景,真正有缺陷的圖片數據往往是比較難收集的,這會直接影響缺陷產品的檢測率。而現在,他們通過大模型數據生成的技術,能將斷膠這種缺陷的漏殺率從1%降到0.01%。
工業互聯網企業卡奧斯,則打造了基于大模型的人工智能裝配系統,來解決離散制造業效率低的痛點。根據官方披露信息,該系統可實現洗衣機工廠產線非加工時間減少不小于20%,工藝設計環節效率提高不小于30%,換產調試環節效率提高不小于50%。
另外,大模型和小模型的結合,也是業界目前看到比較能夠見到成效的一個方向。
東莞一家汽車電子企業,由于一輛汽車上PCB線路板用量多達100多塊,設計工程師們以往在加工生產時,往往需要將涉及到的大量參數轉換后再加工,很容易出錯。但大模型來了后,這家企業和騰訊一起探索了大模型與OCR小模型相結合的方法,能直接將圖紙識別出來,結構化后變成可復用的東西,將參數傳給對應的加工機器。
更多的場景還在不斷被探索。業界認為,隨著大模型的持續發展和多模態技術的逐漸成熟,工業領域的應用場景將進一步打開。
“明年可能會是大模型在各行各業應用的爆發年,我特別看好多模態大模型未來的應用支持,一旦把多模態做了,并且輕量化以后,場景就太多了?!爸钦癖硎?,他還看好大模型在端側和邊緣側的應用,“未來的體量可能遠遠超過現在的想象”。
03 數據,仍然是難點
今年以來,對于大模型落地工業,業界一直有個形象的比喻——把大模型在消費端的落地比作“平原戰”,而把在工業制造領域的落地比作“山地戰”、“高原戰”。一句話總結就是,大模型落地工業,要比落地消費端,困難和復雜得多。
邴金友告訴數智前線,他們與大量工業企業,尤其是制造業企業進行了交流,發現大模型與工業的結合,仍然存在成本、人才、數據,以及大模型技術本身這幾方面的難點。
企業落地大模型的成本,不僅包括算力成本、部署成本,還包括試錯成本、人力成本等。目前,落地大模型成本高達數百萬到千萬。而很多制造業企業的毛利本身相對較低,在新技術投入上相對謹慎。
而從技術本身來看,邴金友認為,大模型的幻覺問題決定了它目前還是概率產出,但工業里面要么是經濟產出,需要100%正確,要么需要干預,也即大模型能不能跟原來傳統的數字技術結合起來,就像人同時有左腦、右腦一樣。
數據是一個更難解的痛點。
一方面,工業領域雖然場景眾多,存在大量數據,但碎片化現象明顯,各家企業對數據的采集、治理等的水平也參次不齊,甚至有大量企業可能在歷史數據采集方面并不充分。
閆同柱舉例稱,過去有大量工業知識和工業數據,都只存在于老工程師、老專家們的頭腦和電腦里,并沒有及時轉化為企業知識資產,逐漸就在人才交替中被遺失掉了?!熬拖裎覈氖涂碧郊夹g,全球都認可,但隨著老專家離職或者離世,有些知識就斷掉了,導致很多新員工進來后又得從頭進行摸索。”
另一方面,我國數據要素市場還在發展早期,尚未建立起比較完善的數據共建共享、數據產權界定等機制,再加上工業企業普遍十分重視數據安全,數據不出企業或園區是剛需,工業領域存在嚴重的跨行業、跨場景數據壁壘問題。實際上,數智前線獲悉,目前幾乎所有工業企業在布局大模型時,都會要求私有化部署。
成本、人才、大模型本身的困難,都需要時間的推移和技術的不斷進步,去逐漸填補。數據的問題,卻需要大模型服務提供方和大量的工業企業,注入更多的主動性,從現在開始,著手去解決。
中工互聯在今年10月推出的萬企賦能計劃,就有一項內容是針對數據問題展開?!八行∑髽I只要你提供數據,我們訓練完就可以免費使用。我們要嘗試一下,明年有沒有企業愿意把數據拿出來,加到一個平臺里面一起來做?!敝钦裾f。
中國電信旗下智庫平臺——天翼智庫的報告也顯示,合作正在成為解決數據問題的主要辦法,一些行業的數據共建共享基礎較好,正在開展實踐,如東北大學、阿里等單位構建了15個以上的面向鋼鐵、紡織等產品表面缺陷公開數據集。
國家政策層面同樣在加速推動數據的互聯互通,今年8月,財政部曾發文表示,數據資產入表將于明年1月1日起實施。“這是一項比較長遠的規劃。”智振認為,基于這一趨勢,未來像他們這樣的廠商在訓練工業大模型時,將有機會找到一些大型的數據發行集團,拿到訓練所需的高質量工業數據。
業界觀察,大模型在工業領域的應用落地,將會是一個漸進式的發展,雖然目前仍有許多難點需要突破,但其價值將在未來一段周期內逐漸釋放。
在這種大背景下,不少業內人士建議,工業企業應該盡快擁抱大模型。簡單來說,企業不一定現在就要投入特別大的精力和金錢,立馬自己訓練一個模型,但一定要多關注這方面的進展,提前進行場景規劃、數據儲備等工作。