制造百科
如何打好工業大數據實施與落地"攻堅戰"?
2021-10-28近年來,隨著企業所擁有的數據日益豐富,以及數據驅動意識的不斷提升,越來越多的制造企業加強了大數據應用探索,并已有一些成功的應用實例。然而,對于很多制造企業而言,在推進工業大數據的應用過程中仍面臨著以下難題:采集了很多數據,如何來分析和利用這些數據,找到與自身業務融合的應用場景以解決實際問題?如何務實推進工業大數據的實施與落地?本文將圍繞著以上問題進行討論和分析,希望為企業開展工業大數據的實施與應用提供啟示與借鑒。
合適的場景是工業大數據落地的關鍵
當前,工業大數據在制造企業已形成加速產品創新、生產工藝優化、生產流程優化、質量監測、能耗管理、設備故障預測、銷量預測、供應鏈優化、智能化服務、個性化定制等典型應用場景,不僅幫助企業優化了現有業務,如指導產品設計、監控與優化生產過程、推動精準營銷、優化供應鏈管理、快速服務響應等,還促進了企業的轉型升級,為產品、服務和商業模式的創新提供了有力支撐。
以上應用場景與突出價值為制造企業推動工業大數據提供了參考,并加快了其大數據探索的決心。但是,工業大數據能否落地,不在于技術的先進性,關鍵是企業能否找到與自身業務融合的應用場景。
然而,工業大數據應用具有非常強的個性化特征,不同企業基于不同的產品、制造工藝、數據基礎、應用需求等,便會產生不同的應用方式和層次;同時,工業大數據的門檻較高,應用場景的效果產出需要企業具備一定的行業知識和數據應用能力與經驗,且當前缺少統一、規范化的工具、標準和流程來支撐。因此,如何找到合適的場景和融合方式成為了眾多制造企業推進工業大數據應用的首要難題。
在筆者看來,企業應用工業大數據的核心目標是創造價值,合適的應用場景一定是能為企業持續帶來價值的,是擁有比較理想的投入產出比的。
基于此,企業在明確自身核心需求與痛點的基礎上,可以從以下三個方面著手確定應用場景的選擇是否合適。
? 業務價值較高。
數據驅動價值已成為企業共識,但并非所有的數據,都值得去深入開展分析挖掘,如一些變化維度低的“死”數據,根本沒有分析價值;也不應為了一些微不足道的性能指標提升而投入大量資源去應用大數據技術。
建議企業可以從那些采樣頻率高、變化維度多的數據或者高價值、關鍵的設備/工序等著手,探究業務應用場景,并基于已有的歷史數據資產,來估算潛在價值高低。
針對這一突出性問題,該工廠詳細評估了刀具的損耗率和因刀具問題導致的產品不良率影響,有效估算了智能刀具管理場景應用大數據分析的潛在價值。最后,通過與產品技術服務商、高校研究團隊的有效協作,構建了刀具狀態在線監測、使用壽命評估等分析應用,提高了產品良率和刀具使用效率與價值。因此,具備較高的業務應用價值,是大數據技術應用的首要條件。
? 復制性強。
如果項目選定的大數據應用場景,只適用于單個或少數的產品,不具備較強的復制性或推廣空間,很可能會因為項目邊界成本高難以持續。建議企業選擇復制性強的應用場景和應用模式。如上例中,無論是100臺還是更多的機加設備,基于統一的技術架構和模型,采集各設備運行的數據,就能實現同樣的場景擴展應用,大大降低項目成本。
? 數據可支撐。
由于大數據分析應用類項目,在早期對業務場景、影響因素的認識很難完備,現有數據資產可否支撐、實際分析結論與假設是否相符等均有待隨著實施深化來驗證。這些不確定性需要在后面的階段,通過強化數據資產(如增加數據采集點、加大現有數據采集頻率/維度等),多次迭代數據模型,并從多個維度去論證建模思路合理性,才有可能形成相對完備的問題理解與目標達成。
八步實施法助推工業大數據項目有序推進
企業在確定了工業大數據應用主要方向的前提下,具體的實施可參考如下步驟,該步驟基于CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行業數據挖掘應用標準流程)并補充了新的內涵。
1、業務理解
從業務角度理解項目目標,并將其轉化為一個可解且可達成的數據分析問題,包括厘清關鍵因素,確定分析問題的范圍和目標等。工業數據分析需要將專業領域的知識和數據模型有機融合,才能得到有價值的分析結果。而數據分析師通常對工業過程缺乏深入了解,業務人員則對數據分析的技術方法與思路了解不深。因此,業務理解的過程需要企業的業務專家和數據分析師通力合作。
2、數據理解與數據的可采集性分析
在理解業務的基礎上,準確建立數據和業務間的關聯關系,包括需要哪些數據、這些數據是從哪兒來,是生產設備、智能產品、復雜裝備等產生的工業物聯網數據,還是來自ERP、MES、SCM等的信息化數據,還是設備在運行過程中所處的環境數據等?是否需要線上、線下相結合的數據等。同時,確定制造企業當前的歷史數據存量和可獲取的數據增量,即在不增加采集點、采集頻率、采集維度等的情況下,可以采集到的數據有哪些。
這一階段需要數據分析師根據經驗對數據顆粒度、數據質與量和數據間的關聯關系等進行初步判斷論證,確定當前的數據是否滿足業務場景的要求。
3、數據準備
對所需的數據進行數據加工與治理,包括原始數據抽取、多數據源融合、數據清洗與質量提升等。一般需要企業成立專項數據治理組織,通過數據集成和定期運維等方式保證業務系統和線下數據準確與完整,包括剔除掉那些假的、錯的、偏差大的、缺失的、不合理的、暫時性的臟數據等。數據準備與預處理環節不僅由數據分析師組成,還包括懂行業know-how的專家,對于一些不合理、不符合物理規律的數據,如燃氣燃煤加熱設備在極短時間內出現溫度數據的急劇變化是不合理的,數據分析師很難發現,需要結合行業專家的經驗認知判斷。
4、特征提取
特征提取即借助統計學方法對數據進行轉換、映射、分析,找到數據中的規律,并進行特征提取,即最大限度地從原始數據中提取特征以供算法和模型使用。這一步非常重要,只有對數據特征有了清晰的認識,企業才能更好地完成拓撲數據結構的搭建,開展數據建模。部分企業由于缺乏對數據的深入探索和理解,一有了原始數據就直接著手構建大數據模型,結果失敗率非常高。
值得注意的是,針對一些特定領域問題 ,特征提取應充分利用行業已有的專業知識,不要將時間過多浪費在該領域早已熟知的行業規律發現上。
5、小數據驗證
如果說在實施工業大數據項目前,是通過歷史數據估算場景價值點,來初步判斷應用場景是否合適。那么,到了具體的應用落地實施階段,則需要依賴現有的預處理數據,對業務場景的價值進行更具體的計算,得出一個可量化的值,從而來驗證數據分析的價值。
6、數據建模
基于業務知識和合適的算法及建模工具,輸出數據分析模型。當前,機器學習、數據挖掘等分析理論、技術發展較成熟,也有很多明確的指導原則和豐富的算法和建模工具,可以幫助企業優選出合適的算法模型。因此,真正的數據建模過程在項目實施過程中花費的時間并不是最多。但值得一提的是,算法不是越復雜越先進越好,應用可解釋、較簡單的算法去解決業務實際問題更值得被關注。
7、模型的驗證和評估
模型的驗證是對分析模型從數據和技術的角度進行充分檢驗評估,確認數據分析的結果或模型是否滿足具體工業應用場景的使用需求;任何模型都有一定的適用前提,模型的評估即是從業務的角度審視模型在什么范圍內有效,有效程度是什么,在什么情形下不適用,需要分場景去驗證和評估。
8、模型上線與迭代
模型的上線是將模型以便于企業使用的方式和要求重新固化,形成便于模型服務調用的形式,如可重復使用的數據挖掘程序、模型服務程序等。同時,模型在運行過程中,還應對模型進行持續的修正、迭代和完善。
如前文所述,與一般的信息化項目不同,工業大數據項目的實施是一個循環迭代、螺旋上升的過程。因此,以上8個步驟會存在多處循環和反復迭代,如在建模階段,假如現有的特征無法滿足模型的開發或者存在過擬合的問題,則需要返回到數據準備,甚至會出現業務理解的修正調整。另外,即使企業基于現有數據完成模型的上線后,還需進一步評估,是否需要增加現有數據量,是增加數據的采集頻率,還是增加額外數據采集點,進一步迭代模型,如此反復,從而不斷優化模型,得到更可靠的分析結果。
來源網絡侵刪
本文地址:http://www.orbwallpaper.com/news/baike/210.html