1 引言
標準在國民經濟和社會發展中擔任重要的角色。在宏觀層面,標準對社會經濟發展全局起到重要作用,是國家基礎性制度的重要組成部分,是可持續發展的重要保障。同樣,當前“得標準者得天下”,標準影響市場的控制權。因而,通過標準與技術的融合,實現技術標準化、標準壟斷化,可以最大限度地獲取市場份額。在微觀層面,標準作為重要技術創新成果的匯集,其事關企業的生存和發展,是企業組織生產和經營的依據,高標準將助力企業高質量發展。
為了適配數字經濟發展,發揮標準化的引領作用需要其進行數字化轉變。標準在數字經濟時代將有效推動企業和行業之間的質量信息協調,是促進生產商、供應商、銷售商、消費者甚至包括競爭對手在內的全產業鏈生態配合的必要基石。在推動數字經濟發展過程中,高質量數字化標準有效實施是提升質量基礎設施能力、串聯改造產業價值鏈的核心要素,也將促進標準與數字化轉型的生產應用緊密結合。數字化將會進一步助推標準化的發展。利用數字化技術對標準化工作和標準本身賦能,創建標準結構和內容的新形式,實現靈活、高效、交互的標準實施過程,推動標準管理體系與管理能力智能化。
2
標準數字化發展歷程
國際上具有影響力的標準化機構為實現多國標準互換性和標準通用性,制定標準數字化轉型相關戰略。2017年,ISO副秘書長在“標準與數字化:擁抱變革”的報告中提出數字化影響下的未來標準化;2018年,ISO通過技術管理委員會94號決議,建立了機器可讀標準的戰略咨詢小組,提出了機器可讀標準(SMART)概念,發布了實施路線圖;2021年,ISO發布《ISO戰略2030》,認為數字技術是ISO變革的驅動因素之一。IEC作為世界上成立最早的國際性電工標準化機構,2017年在發展規劃中提出IEC將繼續為其核心業務的根本性改變做準備,其中包括可直接由機器使用的新型數字標準。
2020年IEC SMB重啟SG12“數字化轉型和系統方案”戰略組,其工作范圍包括數字化轉型有關內容、國際標準的數字化轉型方法等。2021年IEC CB成立“SMART標準化與合格評定”任務組。各國為提高國家產品和技術的國際市場占有率和國際競爭力,出臺多項標準數字化轉型政策。美國航空航天工業協會于2005年提出未來標準將作為一系列數據單元進行管理和控制;2021年,ANSI正式發布《美國標準戰略》,提出數字化工具可以有效地用于優化全球標準的制定。俄羅斯于2019年在《2019—2027年俄羅斯標準化發展措施方案》提出將國家標準轉換為“機器可讀格式”。德國DIN/DKE為支持企業數字化轉型于2017年將“未來機器可執行標準的結構和格式”作為其重點領域。英國BSI于2019年啟動在數字化環境中進行標準協作開發的敏捷流程。
我國為標準數字化轉型進行一系列行動。2009年,中國航空領域相關機構將標準處理、存儲為數據單元形式,并與工業軟件、操作系統等結合,使得標準使用形式能夠基本滿足標準使用需求。2021年10月我國發布《國家標準化發展綱要》,其為我國標準化事業的發展提供了可遵循的綱領性文件,其中對標準數字化給出了明確的方向:“推動標準化工作向數字化、網絡化、智能化轉型”。2022年,籌建全國標準數字化工作組,負責標準數字化基礎通用、建模與實現共性技術、應用技術等領域國家標準制修訂工作。
3
工業生產標準數字化轉型的路徑
當前,工業生產均在進行數字化轉型,但是標準使用與其適配性存在問題。工程技術人員獲取標準嚴重依賴專業經驗和標準使用背景,因此在選用標準時易出現誤區。同時,傳統標準無法與工業生產數字化升級協調統一,因而無法實時掌握貫標效果,難以即時發現標準制修訂中的指標不完善、不齊全等問題。
國家工信部發布《原材料工業兩化深度融合推進計劃(2015-2018年)》,“以公共平臺建設、智慧工廠示范、技術推廣普及為著力點,努力實現流程工業全鏈條全系統智能化”。伴隨著新技術手段不斷涌現及應用水平不斷提升,高新數字化技術在工業生產領域開始覆蓋全產業鏈,進而促進實時洞察各方需求與定制化生產新模式有機結合。正在進行數字化轉型的工業生產領域,最終目標是將人的知識經驗通過系統進行固化,減少人的干預,直至實現無人干預的目標。
在生產經營全流程中,通過數字化技術實現最優生產,系統會自動進行生產優化組合,選擇最優化的方案執行。在此過程中無法離開標準的規范化作用,然而目前標準普遍處于紙質或PDF版,在標準選擇階段,需通過具有一定專業背景及相關儲備的標準使用者經過對標準內容比對和分析,選擇適合應用場景的標準進行使用。在標準使用階段,傳統標準的使用只能依靠人工輸入的方式與數字化轉型的產業鏈進行聯通。
隨應用環境復雜程度提升,標準使用過程的效率相應降低。根據ISO/IEC提出的SMART標準數字化路徑,實現工業生產應用中標準數字化轉型主要分為機器可識別標準、機器可執行標準和機器可決策標準三個階段。
第一個階段需實現將傳統標準文本轉化為機器可識別的文檔類型,為接下來進行標準的數字化技術處理奠定基礎。目前,對于標準文本的轉化分為如下幾步:(1)基于PDF文本進行處理,通過OCR技術,利用文檔中的暗亮,確定其形狀;(2)利用字符識別方法將形狀翻譯成計算機文字;(3)通過文字軟件,結合上下文對最終矢量化文檔進行編輯加工。
第二個階段重點為可根據應用場景選擇性地訪問附有語義的標準內容,主要實現按照需求獲取標準內容。國家標準、行業標準、團體標準等各級標準之間存在技術要求的差異。同時,各領域標準目前已形成體系,各標準范圍之間存在關聯,標準內容本身也存在聯系。在該階段,需將機器可處理的文檔進行數字化加工,賦予其語義,選擇最貼合應用環境的知識顆粒度進行標準離散化處理,深度挖掘內容中的相互關聯性和系統性,使標準不再以文檔的形式獨立存在,而是將標準所包含的知識點形成一個屬于該領域的知識網絡,一個屬于該領域標準的“知識大腦”。根據需求輸入,經知識網絡的分析和匹配,輸出與之相關的標準內容,使得標準的內容更具有靈活性和實用性。在該階段,首先結合具體應用場景對標準中的關鍵元素進行比對分析,對重要指標內容的限定類和限定項進行總結歸納,獲得對接應用場景的基礎模型。基于此,對標準信息的實體、實體關系以及屬性進行抽取,通過對實體的鏈接和重復項的合并進行標準知識圖譜的融合。最后,借助對標準知識的推理和知識圖譜質量評估進行標準知識圖譜的加工以及優化。基于標準知識圖譜,根據具體應用場景進行智能對接,實現智能問答、適用標準推送等一系列標準服務。
最后一個階段,機器能夠以更為復雜的方式執行或解析與標準相關內容。前兩階段主要基于現有標準,進行標準的數字化,而該階段覆蓋面已不局限于現有標準內容,而是基于大數據等數字化智能化技術,實現標準數字化執行與數字化標準的形成。關聯服務于生產現場管控的物聯網平臺,通過IOT協議、智能傳感技術和無線網絡通訊協議等技術,對生產現場的設備運行數據、巡檢作業數據、安全環保數據、物流數據等進行全面采集。同時,面向企業提供的生產運行綜合管理平臺,通過對生產過程數據、實時數據、化驗分析、計量等生產數據的集成,實現對生產執行、調度、運行等業務領域全覆蓋,達到生產信息集成、業務管理協同。
綜合采集上層和下層的數據,實現獲取不中斷的數據流,并通過自學習的方式改善內容處理及訪問方式,使用方可通過自動問答或智能推送獲取目標標準內容。
標準數字化不僅是標準存在 形式的“數 字化”,還包括標準化的數字化,后者主要是利用數字化技術推動標準化工作的生命周期全過程的發展,更好地實現標準的“管、查、用、編”。如果在生產過程中出現標準的缺失,將在數據鏈條中得到即時的反饋。同時,隨著技術、設備等的發展,標準的技術指標也需進行修訂,結合各標準的執行情況和反饋,標準的適配情況也將得到即時預警。基于現有標準知識覆蓋及使用情況進行信息收集,依據實際情況進行標準的制修訂,以開源的方式進行標準的編寫,實現快速迭代和動態更新。針對已形成的標準,工廠可比對已有標準技術指標等相關數據,通過邊緣計算技術實現前端狀態監控、診斷分析和預警報警等功能,為實現生產現場智能化設備監控維護、生產操作管控、安全環保管控等提供數據支持,促進業務模式提升和變革,為智能生產建設奠定基礎。
4
標準數字化關鍵技術
▍4.1 光學字符識別技術
字符作為標準中占比最大的形式,是實現傳統標準向機器可識別標準轉型的關鍵。進行字符的識別需先進行字符特征的機器學習,基于識別系統儲備的相關字符信息,可針對輸入字符的明暗特征等信息進行儲備知識的調用,得到字符的識別結果。當前識別方法分為統計特征字符識別技術、結構字符識別技術和基于神經網絡的識別技術。在識別字符后,根據原排版的格式進行版面恢復。最后根據特定的語言上下文關系,對識別結果進行校正。標準的結構和起草規則嚴格按照GB/T 1.1《標準化工作導則 第1部分:標準化文件的結構和起草規則》進行編寫,與光學字符識別技術結合使用,對識別結果的準確性有一定程度的推動作用。
▍4.2 知識圖譜
傳統標準知識數據庫常以傳統關系性數據庫為基礎,冗余性高,分布分散,關聯性較弱,較少從語義層面挖掘知識的關聯性,其與成體系且具有高關聯性的標準知識本身相矛盾。為打破標準知識的“孤島”,借助知識圖譜將其關聯。構建標準知識圖譜首先需要獲取數據,它們可以以表格、文本等不同結構化程度的知識為來源,對實體識別、關系和屬性進行抽取后,需要對數據進行知識融合,解決來源不同導致的數據交叉、重疊等問題,將來源不同的知識融合成一個知識集合體。為實現結構化、網絡化的知識體系,還需進行本體構建、知識推理和質量評估,以此保障最終標準知識庫的質量。
▍4.3 自然語言處理
標準存在初期是以人為使用對象,為實現從人使用到機器使用的跨越,需要搭建人與計算機之間用自然語言進行有效通信的理論和方法。自然語言處理本質上是基于詞典,通過詞頻統計,上下文語義分析等方式方法進行語料分詞。在標準文本領域中的自然語言處理就是將完整的標準碎片化為最小詞性且富含語義的詞項單元。面對大量標準,一般情況需借助機器學習對其進行處理,除了借助人工標注的傳統機器學習方法還可借助深度學習模型,進而實現不同層次特征的自然語言處理。針對不同的應用場景和專業背景,標準的自然語言處理存在一定的差異性,充分融合領域知識以及專業概念,對關鍵信息進行分解、標注和重組尤為重要。在進行模型訓練的過程中,需將算法的準確度置于合理區間。在標準數字化過程中,標準文本的自然語言處理貫穿全過程,需緊密結合其應用場景和專業領域,以此獲得合適的模型。
5 結語
標準數字化已成為適應全球數字經濟發展下工業生產發展的重要組成部分。我國大部分標準仍處于紙質標準或PDF版,與基本實現機器可識別標準的ISO、IEC等標準化機構存在距離,各領域開始聚焦標準本身,結合應用場景,進行標準數字化轉型,構建覆蓋標準“管、查、用、編”全生命周期的數字生態系統,為我國數字經濟發展保駕護航。標準數字化在未來的發展中存在如下四方面的挑戰:
第一,在技術層面,標準數字化涉及一系列當下最先進的技術,包括數字化加工、自然語言處理,知識圖譜構建技術等,如何攻破各項技術在標準數字化方面的應用是轉型的關鍵;
第二,在數據層面,標準數字化涉及國家標準、行業標準、團體標準、企業標準以及企業內部的技術規范書等文件,存量數據多,由于標準數字化對離散化程度要求高,加工難度大,需根據重要程度進行差異化加工標引,打好數據基礎從而保證將來的應用;
第三,在業務層面,標準數字化建設最終是服務于各公司的工業生產需求,因此在建設過程中應有相關業務專家參與,分析并獲得最適宜的標準知識顆粒度,推動標準及其應用場景的智能對接;
第四,在標準化工作的管理方面,數字化技術將推動標準的全周期更為高效、便捷,隨著線上、開源等多種方式的出現,標準化的管理體制還需要進行調整,且與國家標準、行業標準、團體標準等各級標準相關的制度應根據實際情況和標準本身的特點進行差異化制定。
本文作者:中國石油集團工程材料研究院有限公司 陳心怡 張華 賈君君 楊揚&西安交通大學 謝軍太
-THE END-
素材來源 | 新工業網