國家標準GB/T 40035-2021《雙語平行語料加工服務基本要求》于4月30日由國家標準化管理委員會正式批準發布,將于2021年11月1日實施。
隨著經濟全球化的深入發展,以及大數據和云計算技術的廣泛應用,機器翻譯技術近年來得到迅猛發展,各類翻譯軟件和語料庫如雨后春筍,為經濟社會發展和國際交流合作帶來了極大便利。然而,機器翻譯質量很大程度取決于語料質量;由于缺乏語料加工相關標準的支持,產業發展出現了無標可循帶來的亂象。特別是在語料加工服務方面,無論是國內還是國際上都沒有相關標準,一定程度上制約了該行業的可持續健康發展;由于長期缺乏雙語語料加工技術服務相關指引,產出的語料質量層次不一,無法達到機器翻譯對雙語訓練語料的質量要求,導致機器翻譯的質量難以進一步提高。
《雙語平行語料加工服務基本要求》國家標準的出臺填補了國內語料加工標準的空白,通過標準的有效實施可望實現行業的有序發展;本標準通過明確雙語語料加工服務的過程及其服務的要求,為雙語語料加工相關企業提供權威的生產研發依據,有效提高雙語語料加工的管理水平及雙語語料質量,為今后申報相關國際標準奠定了基礎。
該項標準是根據國家標準化管理委員會《關于下達2019年第四批推薦性國家標準計劃的通知》要求立項制定的,由全國語言與術語標準化技術委員會(SAC/TC 62)歸口申報并組織制定。中國標準化研究院擔任起草工作組組長單位,中國翻譯協會、上海一者信息科技有限公司、中譯語通科技股份有限公司、上海佑譯信息科技有限公司、北京悅爾信息技術有限公司、蘇州聯躍科技有限公司、四川語言橋信息技術有限公司、北京百度網訊科技有限公司、沈陽雅譯網絡技術有限公司、北京語言大學、北京郵電大學等單位參加了起草工作。