“借助寧波人工智能超算中心的強大算力及人力支撐,產品研發使用的模型訓練周期從4天縮短為兩天,語義語音識別精度提升到93%。”在寧波新材料(國際)創新中心一棟辦公樓里,薄言信息總經理郭文峰正在介紹“薄言輕語”最新的技能。
寧波薄言信息技術有限公司,位于高新區寧波新材料(國際)創新中心,是一家專注于通用機器學習和自然語言技術研究的科技企業。2003年,作為高層次人才項目,由寧波中科信息技術應用研究院引進孵化。
扎根甬城十年,薄言已是寧波地區估值最高的人工智能創新企業,孕育并迭代了“薄言輕語”,類似人腦思維系統般復雜而精妙的人工神經網絡。這個運行在大型GPU(圖形處理器)集群上的網絡,擁有數十億神經元參數,能通過深度學習來獲取信息,并歸納新知識以及它們之間的聯系。
這些年,在各類測試、比賽中,薄言開發的對話機器人在中文、英文領域均處于全球領先水平。其中,2020年,創造中英文閱讀理解OpenQA世界紀錄;2019年,獲評微軟MS MARCO閱讀理解評測第一名。
值得一提的是,薄言搭建的“輕語”虛擬助手平臺,正幫助企業消除垂直領域數據少、訓練難的壁壘,快速打造專屬AI聊天機器人。目前已與華為、京東、小米、南方等知名企業達成合作,也讓上千家中小微企業有了自己的專屬AI。
而橫空出世的ChatGPT,也讓薄言看到了自己所處領域正迎來新浪潮,有了更多可能性。
從本質上來說,ChatGPT是一款基于GPT(預訓練生成式轉換器)技術的大語言模型。大語言模型極大地改變了自然語言處理領域的研究范式,使得理解、生成、邏輯、記憶人工智能核心基礎能力越來越強,更接近擁有人類智慧的通用人工智能。
算力是AI發展的底層土壤。訓練大語言模型,算力特別是智能算力要跟得上。以薄言為客戶定制的一套即將上線的AI客服系統為例,項目初期每天有十幾萬條電網相關文本和語音信息要處理和分析,企業內部數據中心難以承受,需要超強算力燃料補給。
今年1月,寧波人工智能超算中心(一期)正式上線運營。作為首批試點企業,薄言依托超算中心的算力進行NLP(自然語言處理)模型訓練,搭建全面、專業的任務型機器人資料庫。
郭文峰說,模型訓練時間顯著縮短,版本迭代速度加快,幫助企業輕松應對云服務產品更新迭代所帶來的服務可用性及準確率降低等技術挑戰,幫助輕語虛擬助手平臺自助解決大部分的產品售后服務問題。“較之上一代,語義語音識別精度提高了10%左右。”
據介紹,通過超算中心智算算力的加持,薄言訓練出針對細分行業領域大語言模型,利用領域大模型底層強大的文本閱讀、關鍵信息抽取以及上下文理解能力+領域知識+輕語平臺,這三者相互結合給行業帶來新的體驗。目前,薄言大語言模型的服務方式同時支持公有云和私有化,并已在醫療、電商行業有成功簽約案例。
深度學習架構和AI芯片,是大語言模型的算力底座。據了解,目前國產芯片在設計能力上逐步縮小與海外巨頭的差距,但AI芯片的軟件生態建設、基礎架構等還掌握在巨頭手中,因此適配性、資源限制、生態系統是國產芯片的突破口。
“架構、編程模式、開發環境都需要相應的學習并對應改造,有可能增加開發者的難度和成本,但有些‘坑’是必須要踩的。”談及眼下大語言模型的訓練及落地應用,郭文峰坦言依舊有重重困難要解決。
“機器能思考嗎?”1950年,艾倫·圖靈在《思維》雜志上發表其著名論文《計算機器與智能》,開篇發問。在這一問題被拋出之后的歲月里,人工智能技術日新月異,尤其是近兩年AI頂流ChatGPT的問世,更讓人類對“圖靈之問”的答案深信不疑。
“采采芣苢,薄言采之。采采芣苢,薄言有之……”,“薄言”一詞來自《詩經》,引申為在大自然里辛勤愉快勞作。
“以大語言模型為代表的人工智能正在深入各行各業,加速產業升級和經濟增長。”郭文峰稱,薄言將繼續扎根寧波,以智能感知共性關鍵技術和應用技術為主攻方向,為寧波算力生態構建、高質量發展作貢獻。
(來源:寧波市科技局)