標準對話
為探究我國標準數字化工作的進展情況,2023年12月10日,《中國標準化》雜志社邀請中國標準化協會理事長于欣麗為主持人,中國標準化研究院國家標準館副館長甘克勤、中國標準化研究院標準化理論戰略研究所副研究員劉曦澤、中國標準化研究院基礎標準化研究所副所長王海濤、機械工業儀器儀表綜合技術經濟研究所所長歐陽勁松、國網思極數字科技(北京)有限公司副總經理王思寧、中國電子技術標準化研究院標準創新服務中心主任崔靜、中國航空綜合技術研究所研究員/專業總師曹平、中興通訊有限公司首席ITU標準總監曲至誠為嘉賓,展開了一場標準人的對話。
習近平總書記指出,數字經濟是全球未來的發展方向,要大力發展數字經濟,加快推進數字產業化、產業數字化,推動數字經濟和實體經濟深度融合。2023年2月,中共中央、國務院印發了《數字中國建設整體布局規劃》。該規劃指出,建設數字中國是數字時代推進中國式現代化的重要引擎,是構筑國家競爭新優勢的有力支撐。加快數字中國建設,對全面建設社會主義現代化國家、全面推進中華民族偉大復興具有重要意義和深遠影響。
當前,百年變局與世紀疫情交織疊加,經濟全球化遭遇逆流,新一輪科技革命和產業變革加速演進,做大做強數字經濟意義重大而深遠。這不僅是提升產業鏈供應鏈自主能力、打造未來競爭新優勢的迫切需要,也是推動制造業高質量發展、支撐構建新發展格局的重要途徑,更是搶占國際競爭制高點、把握發展主動權的戰略選擇。
數字經濟時代,數字化變革觸及我們生產生活的方方面面,改變了傳統的業務模式和價值鏈,模糊了物理世界和數字世界之間的界限。與第四次工業革命相關的數字產品和服務已經深刻改變了我們的生產和消費方式。
標準,作為質量基礎設施的重要組成部分,無論對于政府、企業和整個社會,高質量的標準及其有效實施都是推動數字化變革的關鍵因素。
今天我們以“標準數字化的階段性目標與實踐”為題,以對話形式邀請學術界和產業界的嘉賓交流我國標準數字化工作在科研和實踐中的進展。
今天的對話圍繞5個問題進行:一是對標準數字化頂層設計的理解與建議,請國家標準館甘克勤副館長來介紹;二是標準數字化推進的階段性設計與目標,請標準院戰略所劉曦澤來介紹;三是標準數字化的重點突破口(核心難點或問題),請標準院基礎所副所長王海濤來介紹;四是標準數字化國際進展情況及與國內的對比,請機械工業儀器儀表綜合技術經濟研究所所長歐陽勁松來介紹;五是本行業在標準數字化方面的實踐與探索,請歐陽勁松所長,以及國網思極數字科技(北京)有限公司、中國電子技術標準化研究院標準創新服務中心、中國航空綜合技術研究所、中興通訊有限公司分別介紹各自的工作情況。
話題1:
對標準數字化頂層設計的理解與建議
對標準數字化頂層設計的理解與建議,我主要分三個層面來說,一是標準數字化頂層設計的理解,二是標準數字化的需求和存在問題,三是標準數字化的建議。
第一、標準數字化頂層設計的理解
對標準數字化頂層設計的理解離不開ISO SMART的定義,ISO SMART(Standards Machine Applicable, Readable and Transferable)為機器可應用、可識讀、可理解的標準。第0層是傳統紙質標準(PAPER)。第1層是開放數字格式標準,“提供檢索和閱讀,比如PDF格式”。第2層是機器可讀文檔,即“結構化標準文檔,內容可被軟件處理”,這是在“語法”層面把標準進行拆解,拆成篇、章、節等段落,以及表格、圖片等語法層面的內容碎片,進而存成XML(Extensible Markup Language, 擴展標記語言)或JSON(JavaScript Object Notation,一種輕量級的數據交換格式)。目前,標準館用技術手段把所有的標準進行了OCR識別,并自動生成機器可讀文檔,該項工作在2013年已經全部完成。第3層為機器可讀內容,即“語義增強內容,為一個目的接受多個標準的內容”,這是在“語義”層面,把標準組織成知識圖譜,也是我們常說的標準剪裁。舉個例子,喝茶至少和三類標準有關,茶葉標準、飲用水標準、杯子標準,可三類標準剪裁成專門針對喝茶的標準。盡管其存儲形式也是XML或者JSON,但“機器可讀內容”與“機器可讀文檔”最大區別正是其語義的表達。產品標準的語義,就是揭示標準化對象及其屬性的關系。這也是標準館目前在做的工作。我們針對26,000余項國家、行業、地方標準中的產品標準,做了標準化對象和指標項的知識組織,形成了87萬余條的指標數據,初步具備了開展機器可讀內容層面的標準知識服務能力。第4層為機器可解釋內容,即“具備信息建模能力以表達內容關聯要素,具備自學習的分析驗證閉環能力,使得內容可達可推理,形成不間斷的價值流,提供智能問答或預測內容”。這是在“語用”層面,描述標準文獻的智能應用,主要包括:智能問答,基于標準知識圖譜,能夠去理解和回答問題,在一些實踐應用場景,也能基于標準化對象和屬性自動生成文檔;不間斷的價值流,就是展望從標準研制到應用的全流程,全部是數據形式,機器識讀,沒有人的參與,這就是價值流的不間斷;具備自學習的分析驗證的閉環能力,使內容可達可推理,即基于標準構建流程模型,使得內容可以進行推理,形成作業流程指導或者根因分析等專家系統,這也是我們目前正在研究的方向。
我認為標準數字化是一個交叉學科,包括圖書館學指導業務,標準化定義應用場景,計算機突破技術瓶頸,最終共同實現價值體現。我們需要用圖書館學、語義網和知識本體的理論去指導這個方法,用標準化理論與方法的來定義各種場景的應用需求。作為管理學科,在企業的應用場景中有沒有數字化賦能標準化的需求,這種需求如何去提升,如何去挖掘?這是標準化學科需要做的事情。計算機學科做的是突破技術瓶頸,如高效計算、機器學習和自然語言處理等,機器能解決的只是代替人的重復性工作,解決的是從1到N的問題。從0到1的過程,一定是標準化的研究人員去根據需求分析出來,根據應用場景去設計。最后是價值體現,數字化賦能標準化、提升標準的實施能力,這是我現在認識的兩個價值。我認為標準化本身是一個管理學科,在政府或企業的應用場景中,標準化還是應充分體現出管理特性,不管是標準大數據、標準制修訂或者標準編寫等軟件平臺,都是為政府或企業的標準化實施應用服務的,目標是提升它的數字化實施能力,讓標準能夠快速地應用到企業的具體工藝場景中,能夠快速地讓政府做出正確的決策。
第二、標準數字化的需求和存在問題
在需求上,標準數字化的信息服務,主要包括情報服務、檢索服務和行業應用。情報服務,主要包括起草單位大數據分析,提出單位、歸口單位、起草人和國別分析;檢索服務,主要包括擴展全文搜索,建設指標數據庫,細化檢索體驗,也就是要做到查到、查全、查準、關聯;行業應用,包括標準制修訂、標準編寫、標準管理、標準查新查重、標準對比等。
信息服務包括傳統服務和增值服務。傳統的服務包括文獻檢索、文獻閱覽、信息咨詢、信息跟蹤、信息培訓和信息推送,傳統服務盡管需求明確,但是缺乏服務深化的潛力,而且供給飽和;增值服務主要包括專題的數據服務、知識服務、情報服務和工具服務,其主要問題為行業需求不明確,需要技術引領,產品先行,更多地引導和挖掘。
第三、標準數字化的建議
現階段國家標準館的標準數字化主要發展方向,一是定位需求痛點,用數字化賦能標準化,進而解決政府和企業的標準化管理需求,需求痛點就是標準化需要數字化賦能;二是補足短板,我們需要一個面向各行業的全流程解決方案,我們現有的全流程解決方案還存在著用戶體驗以及技術上的難題需要突破,需要大量的需求磨合和軟件迭代升級;三是應用人工智能技術,包括解放傳統工作和助力創新工作;四是延伸產品線,把標準數字化集成到企業的流程、設計、制造、管理、運維工具中。
點評:于欣麗
甘克勤介紹了ISO SMART的定義,介紹了標準館這幾年對標準數字化所做工作,以及取得的成果。標準館在2013年已經達到了SMART第2層,現在正在做第3層,取得了很好的成效。我們看到,在頂層設計方面,我國已經有了一個比較清晰的思路和框架,當然還需要不斷完善。
話題2:
標準數字化推進的階段性設計與目標
我認為標準數字化推進的階段性設計與目標這個問題,包括兩個層次,第一個層次是要回答標準數字化作為一個新興事物自身發展的規律是怎樣的?第二個層次是面對這樣的規律,我們如何更好地發揮它的作用,即開展階段性設計。針對第一個層次的問題,可以參考一下知名咨詢公司Gartner提出的技術成熟度曲線模型。我認為標準數字化作為一個新興事物,是同樣符合成熟度曲線的。首先,它會進入萌芽期,萌芽期間大家對相關概念、技術體系與技術路徑并不熟悉;然后隨著研究相關概念與技術路徑的人員不斷增多,很多技術解決方案就會被提出,這個時候就進入了膨脹期,這個時期會有很多的主體參與到標準數字化的研究與實踐中,形成蓬勃向上的態勢,目前我們就處于這一時期;第三個時期為冷靜期,就是大家飽含熱情去開展標準數字化研究與實踐,發現還會面臨許多更深層次的問題,比如數據之間通用性、兼容性、互操作性的問題,還有我們標準化體制機制轉變的一些根本性的問題,此時,人們開始逐漸冷靜思考如何構建標準數字化生態,各種實踐方案也會逐漸通過標準化形成統一的接口,建立一致的底層框架與規則;第四個時期叫做復蘇期,復蘇期就會有比較成熟的企業或者機構站出來整合標準數字化相關資源,推進共識和底層規則的建立,構建共享的基礎性框架,逐步形成相關的標準數字化生態,達到標準數字化真正支撐經濟社會數字化轉型的目的;最后一個時期是成熟期,這個時候會基于標準數字化的一些基礎性成果衍生出很多新的商業模式、服務模式、工作模式,為大家提供更為明確的服務,滿足人們的需求。這五個時期是從新生事物產生發展的內在規律角度,對標準數字化發展的可能趨勢做的一個預測。
針對這樣的內在規律,我們可以分四個階段進行設計,以應對各個時期存在的可能風險。
第一個階段叫做頂層謀劃、系統布局階段。這個階段對應著標準數字化發展的萌芽期和膨脹期,目的在于盡快提出標準數字化可能的發展方向,有重點、分方向地推動標準數字化轉型工作,避免萌芽期缺乏共識的情況,以及減少膨脹期自由發展可能造成的資源浪費。因此,這一階段的工作重點是形成演進路線圖、標準體系、建設指南等頂層設計成果。這一階段持續時間不會太長,因為要盡快為大家指明一個方向。這一階段主要包括三方面工作:第一,要跟蹤國際立足實踐,充分論證標準數字化轉型的必要性與可行性。需要進行大量的用例征集,更清晰地進行需求分析與路徑識別。第二,要設立國家級的科研項目,系統推進標準數字化關鍵技術攻關。因為我們知道標準數字化雖然是一個新生概念,但是其實它是涉及了一整套的技術體系。而且標準作為國家質量基礎設施(NQI)的重要組成部分,需要有國家層面的項目來進行統籌和推進。現在我國已經圍繞機器可讀標準以及標準數字化演進關鍵技術與標準設立了兩個重點研發計劃項目。第三,要成立全國性的專業標準化技術組織,開展標準體系建設,去規范標準數字化轉型的底層規則框架。現在我國也已經在國家標準委指導下成立了全國標準數字化標準化工作組(SAC/SWG 29)。經過這一階段,基本能夠構建標準數字化共識,明確發展方向與技術路徑。
第二階段是構建基礎、有序推進階段。我認為這一階段大概需要使用3~5年的時間,完成相關基礎性工作。這一階段對應標準數字化發展的冷靜期,要充分發揮好冷靜期的優勢,集中力量把轉型基礎構建好。主要包括四方面基礎。第一是基礎數據庫與用例集的建設。標準數字化的核心資源就是數字化處理之后的標準內容數據。這些數據的生成、存儲、共享共建、管理都需要花費大量人力物力來解決。同時,用例集作為數字化轉型中必不可少的資源,也需要進行專門建設。它可以用于相關軟件的需求分析、開發和測試,也可以用以幫助大家快速熟悉軟件的使用和形成標準數字化時代所需的能力。第二是基礎性標準。在數字化轉型場景中,標準越來越起到引領的作用,針對標準數字化,需要盡快研制術語、分類、指南、規范、評價等系列標準。指導和支撐各主體開展標準數字化活動。第三是基礎性制度的建設。標準數字化涉及的技術并非開創性的,但隨著數字技術的引入,對現有標準化相關機制和制度造成的影響卻是非常顯著的。比如英國的BSI Flex采用數字技術和信息化的管理方式提升標準制定速度,將標準制定周期縮短到只有六個月,程序上更將新版本標準的征求意見環節與上一版本標準的使用環節合并為同一環節。這無疑需要建立新型的標準化機制,并制定和健全相應的標準化制度規范,才能保證這一程序有效運行。因此需要從理論方法、協作框架、業務機制等方面對基礎性制度進行深入而系統的研究。第四是基礎軟件系統。其中的內涵很豐富,比如現在涌現出標準結構化編寫工具,標準內容全生命周期管理系統,以及內容生成大模型的引入。這方面的基礎建設可以說是標準數字化轉型創造的新的價值增長點,也是大家都在踴躍嘗試和參與的工作。但需要注意,軟件系統雖然重要,建立好其他方面基礎才能使軟件系統得以體現價值。
第三個階段是產業互聯,打造平臺階段。這一階段可能需要5年左右,對應標準數字化發展的復蘇期。要充分發揮好產業龍頭、鏈主企業的帶頭作用,將階段二的基礎性工作成果與產業發展深度融合,形成支撐產業高質量發展的平臺。主要包括三方面工作:一是在廣度上,將階段二的各類基礎性數據、標準、制度、軟件進行推廣應用,整合相關資源,推動各產業開展領域平臺建設;二是在深度上,挑選重點產業,比如智能裝備、航空航天、信息通信、檢驗檢測等。面向具體場景打通標準、計量、檢驗檢測、認證認可等方面的數字質量基礎設施,推動產業鏈整體轉型升級;三是開展標準數字化轉型的經濟效益評估,構建轉型工作閉環,推廣相關成果經驗。
第四階段是智慧融合、塑造生態階段。這一階段對應數字化發展的成熟期,是充分發揮標準數字化價值的階段。經過前面幾個階段的努力,標準數字化轉型工作已經具備與產業融合發展、服務經濟社會需求的能力,需要開展長期建設與推進工作。主要涉及四個方面:一是要深入推進標準數字化與產業的融合,賦能產業鏈優化升級。在階段三我們已經推動整個產業鏈的標準數字化轉型,那這個階段就需要進一步升級。二是要推進標準數字化自身向智能化發展,增強標準化能力,充分顯示標準數字化轉型的價值,例如可以深入地去探討和使用大模型、人工智能技術在標準數字化領域更深層次的應用。同時,也需要我們去適應新型的面向數字化的標準化方式。第三是強化制度建設。保證面向數字化的標準化活動有序開展,有效支撐國民經濟發展。第四,推廣實踐經驗,加強國際合作與交流。這其實是一項需要貫穿1~4階段的工作,我們國家的標準數字化轉型有其自身特點,更多的是從系統頂層設計的角度、系統規劃的角度、制度建設的角度去引領和推動相關科研與實踐工作。通過建設國家層面的標準數字化基礎設施引領、服務和支撐行業、領域、產業的數字化轉型發展。這是我們的特點,也是寶貴經驗,同時我們也需要學習國際國外先進的理論、方法以及制度建設經驗。這樣才能更好地融入國際標準數字化生態。
點評:于欣麗
劉曦澤從戰略的高度介紹了標準數字化的產生與發展。標準數字化經歷了萌芽期、膨脹期、冷靜期、復蘇期和成熟期。分為四個階段,第一階段是頂層謀劃、系統布局階段;第二階段是構建基礎、有序推進階段;第三階段是產業互聯,打造平臺階段;第四階段是智慧融合、塑造生態階段。劉博士提到了Flex標準,我認為它有很多優點,但是我們在看到它的優點的同時,行動上要慎重。BSI 2022年底國家標準53,500多項,而Flex標準是2020年1月才開始的第一項,截至2022年底,一共才22項,平均每年7項。它不是主流的,還處于探索期。
在標準數字化工作推進中,應該說在很長一段時間我們都會處于打基礎、尋共識的初期階段,在這個階段,要不斷吸納各方,包括國際國外的思考和實踐。
話題3:
標準數字化的重點突破口
(核心難點或問題)
標準數字化概念最早是從德國的工業4.0引出并不斷演化延伸而來,在2018年形成了ISO SMART的概念,這一概念是集成性的概念。從ISO SMART的5層概念圖可知,從0到3層主要描述標準形態和處理,第4層開始轉向描述標準內容怎么用,面向應用來展開。標準數字化的目的是讓標準更好地給人和機器使用,因此要兼顧人和機器兩個角度。目前,標準數字化還有很多技術問題需要解決,一方面是自然語言的復雜性、內容多樣性導致標準處理難;另一方面是標準應用難,應用場景復雜,標準中定性的內容(如原則要求等)也很難自動化應用。
目前我國國家標準數量很多,對企業、行業來講,執行的不僅包括國家標準,還有大量的行標、地標、企標,也有各級管理機構發布的規范、指南等文件,這些都是標準數字化所要處理的對象。
標準數字化技術總體而言可分為兩個層次:第一個是共性技術層面,解決通用、共性問題,并給出一般性解決方案,如自動解析處理、智能編寫、全過程管理、結構化表示、智能應用等;第二個是個性技術層面,要結合具體領域特點,進行改造和優化,比如電力領域標準數字化就要考慮電力專業特點、場景和管理要求,需要具體問題具體分析。
標準解析、編寫、管理方面,主要涉及自然語言處理、知識圖譜、本體論、機器學習、大語言模型、數理邏輯等理論和技術。目前,這些技術都有比較廣泛的研究和應用。特別是近兩年,大語言模型(LLM)發展迅猛。大語言模型從通用性、處理效率及智能化程度上,確實有很大的優勢,但在應用大語言模型的時候,要特別注意數據和算法傾向性、安全性、可靠性問題。無論是大語言模型還是其他技術,在標準化領域應用時,未必能直接使用,直接使用的效果未必很好,需要再訓練、改造、優化或者適配。
其次,也要解決結構化表示問題,涉及存儲、共享、處理、標注等一系列技術問題。對于內容的結構化形式和要求,有一些成果可以參考。比如國際標準化組織語言與術語技術委員會(ISO/TC 37)下面有兩個分委會,其中術語資源管理分委會(ISO/TC 37/SC 3)提出了術語結構化的標準,目前已經納入ISO標準數字化基本的標注框架。標準術語部分的結構化標注,就采用了ISO/TC 37發布的ISO 30042:2019《術語資源管理 術語數據庫交換(TBX)》。另外,ISO/TC 37下還設有語言資源管理分委會(ISO/TC 37/SC 4),專門制定發布了一系列關于語言標注、內容標注、語義標注的國際標準,如針對時間、事件、角色、空間位置關系、數量信息等相關語義要素的標注,給出了標注基本要求、流程、方法、框架等。這些標準可以用來作為標準結構化的參考。結合具體的結構化要求,還需要設計專用的結構化表示方法。
另外還有標準應用相關的技術問題。標準數字化最終的目的都是為了讓標準更好用。這更好用一方面是服務人,一方面是服務設備。要分析標準應用場景,將數字化手段與應用場景深度融合。舉一個例子,醫院的自動血壓計是一個數字化的場景,血壓計對血壓有預設的指標,這些預設指標在醫學里是標準指標。如果超過或者低于這個值都是不健康的。2022年,《中國高血壓臨床實踐指南》對高血壓判斷標準進行了更新,我們可以把它視為標準的修訂。修訂之后,怎么讓原有的血壓設備或者機器能隨之以最簡單、人工干預最少的方式更新指標數據?例如:如何自動“通知”所有血壓設備更新判斷指標、設備如何自動獲取并使用新的指標等。所以對于標準數字化應用場景已經不是簡單的查詢、瀏覽、檢索,而是要與實際的行業、產業,甚至具體的設備進行密切的融合、整合。這也就是為什么第4層(level 4)特別提出通過自學習、分析、驗證改進內容處理和訪問能力,實現價值鏈中無干擾數據流,實現自動問答或預測性內容服務。
此外,商業模式、產業鏈、價值鏈的創新也是標準數字化的一個難點。由技術的變化、融合的需求,引發出商業模式的變化,同時市場格局、產業鏈、價值鏈也發生了變化。一方面是產業鏈各方在應用標準時,對自身價值鏈會產生影響,同時相互間在標準理解、應用方面將比較容易達成一致,提高市場共識和開放性,減少信息差所導致的糾紛。另一方面,信息技術公司將以標準數字化為切入點更加深度參與各行業數字化轉型,這對信息技術公司的技術能力有了更高的要求,如必須要有機器學習、人工智能等相關積累,不再是簡單實現查詢檢索和網頁開發,從而提高了行業準入門檻。
針對技術方案、應用和商業模式的難點,國際上也是達成了共識。ISO/IEC SMART項目組也劃分為三個子項目:技術方案、商業模式以及用戶用例。用戶用例是為技術方案研究、商業模式創新提需求。ISO/IEC最早開展工作的時候,不是做技術研究,是先做用戶用例的調研,在所有的成員國和TC里調研相關的用戶用例,去了解大家在行業里想怎么用,或者已經用了什么,然后再基于這些去設計技術方案,設計新的商業模式。可見,標準數字化不是一個簡單的技術問題,是和產業行業深度融合、實現數字化轉型的解決方案。
最后需要補充的是,以上這些都離不開基礎性工作的支撐,如基礎術語、基礎資源等。例如,德國最早提出類似的概念叫做機器可執行標準,后來演變成了機器可用可讀可遷移標準,就是SMART標準。在這個過程中,大家對術語的內涵的理解,其實是不斷細化深入的。同時基礎的數據資源也是不可或缺的。基礎數據資源(如知識庫、數據庫等)是標準數字化所有處理、應用以及深度融合的重要支撐基礎,尤其是涉及具體行業和產業層面的,更離不開專業領域的數據資源。
點評:于欣麗
王海濤對SMART定義做了一些他的分享。實際上我理解就是標準數字化既要兼顧人,還要兼顧機器,是給人和機器兩個方面使用的。另外在標準數字化過程中要兼顧到共性技術層面和個性技術層面的內容。他還介紹了ISO/TC 37的工作,關于語言和術語,我理解所有的標準都是語言,自然語言處理做了大概有30多項的國際標準,這些標準我們可以借鑒、可以用、可以轉化,語言進入到了專業領域就是術語。在這方面,也充分發揮一些作用。
在國內,多個機構開展標準數字化研究,不能說哪個機構的路線就是正確的、科學的,同樣也不能過于武斷地說哪個機構做的是偏頗的、錯誤的,需要在不斷碰撞中找出共識性的路徑來。
-THE END-
素材來源 | 中國標準化