中共中央宣傳部委托新華通訊社主辦

金山辦公在合作、服務、供給端的AI探索

2024-06-28 16:15
來源:半月談網

中國AI產業(yè)在加快形成新質生產力過程中如何發(fā)力、定力、蓄力

金山辦公在合作、服務、供給端的AI探索

導讀:金山辦公副總裁、研發(fā)中臺事業(yè)部總經理姚冬日前接受《半月談》關于AI產業(yè)如何加快形成新質生產力的主題調研訪談,以WPS的AI創(chuàng)新為出發(fā)點,談到了圍繞新質生產力,作為辦公AI產業(yè)領域代表的金山辦公,在合作、服務、供給端如何發(fā)力,為什么有定力,要怎么蓄力。

根據中共中央、國務院印發(fā)的《數字中國建設整體布局規(guī)劃》,2025年要基本形成橫向打通、縱向貫通、協調有力的一體化推進格局,數字中國建設取得重要進展,數字經濟戰(zhàn)略地位不斷提升。

金山辦公(SH:688111)和華為鴻蒙近日達成的合作,正在成為中國企業(yè)將規(guī)劃進行市場化落地的一部分。6月21日至23日,在2024華為開發(fā)者大會上,WPS 鴻蒙版正式亮相。在亮相之前,WPS完成了大量的基礎設施工作,其中包括:超過4000萬代碼行跨平臺移植;跨平臺的交互界面兼容;在移植代碼的同時,推動第三方跨平臺基礎設施的建設。

金山辦公副總裁、研發(fā)中臺事業(yè)部總經理姚冬日前接受《半月談》關于AI產業(yè)如何加快形成新質生產力的主題調研訪談,以WPS的此次創(chuàng)新為出發(fā)點,談到了圍繞新質生產力,作為辦公AI產業(yè)領域代表的金山辦公,在合作、服務、供給端如何發(fā)力,為什么有定力,要怎么蓄力。

姚冬在2024華為開發(fā)者大會現場

合作端:合力探索辦公新質生產力

更積極地合作,是現在許多中國企業(yè)在新質生產力領域,合力探索的關鍵詞。

從規(guī)模上來看,金山辦公和華為鴻蒙的此次基于WPS鴻蒙版的合作,相當于做了一次大體量的基礎設施建設。從實現速度上看,姚冬表示,“如果從拿到第一臺鴻蒙設備樣機那天算起,整個過程歷時八個月?!?/p>

他認為這項合作的實現難度在于,面對鴻蒙這個全新的操作系統,合作過程相當于把軟件重新編寫一遍。令人欣喜的是,雙方的目標,放在國家層面、行業(yè)發(fā)展層面、企業(yè)對市場的預期層面來講,都高度一致。用姚冬的話說,“鴻蒙團隊到金山辦公駐場,有時候下班比我們還晚?!?/p>

合力換來了成果。目前,WPS鴻蒙原生應用已在全端流暢運行,WPS AI也在多端同步上線,數十項AI功能都遷移到了HarmonyOS NEXT。

WPS鴻蒙版,新增跨端調用、跨屏協同、墨跡批注等功能

這是新質生產力在辦公領域的切實落地,而要發(fā)力實現這個和新質生產力有關的目標,姚冬認為,需要實打實的工程能力,久久為功作為支撐。

事實上,金山辦公多次參與國家重大科技專項的“核高基”課題(核心電子器件、高端通用芯片及基礎軟件產品)項目。從2017年開始,姚冬在公司內牽頭成立AI團隊,部分現在的AI創(chuàng)新,也和工程能力的歷史積累密不可分。

姚冬認為,可以把AI分成三段鏈條:算法、模型、產品(服務)。從算法到模型,如何做分布式計算、搭建萬卡集群等,大部分都是工程問題;再從模型到產品(服務),比如做推理框架、負載均衡、交互體驗界面等,也要靠工程來實現。

他說,在整個AI鏈條當中,從核心的科學算法到最后用戶能體驗到的產品(服務),大部分是靠工程、研發(fā),這個問題解決不好,算法只能停留在論文階段。

金山辦公發(fā)布的2023年年報顯示,報告期內,公司研發(fā)人員共計3087人,占總員工數比例約68%。其中研發(fā)投入14.72億元,同比增長10.60%,研發(fā)費用率約32%。

這些都是金山辦公在AI創(chuàng)新時的定力。

服務端:對政企用戶效能的實際提升

在離政企用戶最近的辦公場景當中,現在AI實際能發(fā)揮的效應有多大?這也是本次調研訪談的重點之一。

據了解,經過36年的發(fā)展,金山辦公的WPS 365服務的政企用戶已達1.7萬。其中包括華潤數科、蒙牛集團、通威股份等,行業(yè)覆蓋零售批發(fā)、服務、制造、建筑、運輸、教育、住宿餐飲、軟件與信息技術服務等。

AI協同進入辦公場景,對企業(yè)較為明顯的效能提升,是通過激活企業(yè)沉淀的數字資產,使歷史數據發(fā)揮效應。

僅舉一個例子,姚冬做了這樣一個簡單計算:以一家千人規(guī)模的企業(yè)為例,假設一天產生約500篇文檔,一年的文檔量約18萬篇,十年就接近180萬篇。這些文檔沉淀下來,就是企業(yè)的數字資產。

他認為,過去的文檔存儲解決的是“存放”的問題。但簡單的關鍵詞搜索其實效率很低,比如有的文檔通篇沒有“簡歷”兩個字,但確實是一份簡歷;有文檔文件但找不到所需要的內容,和文檔丟失其實不存在本質區(qū)別。AI的導入,可以開始做到像人一樣去閱讀,用自然語義識別等手段,開發(fā)“企業(yè)大腦”去幫助解決這個問題,進而進行歸納、分析的進一步輔助工作。

2024華為開發(fā)者大會現場,姚冬展示產品戰(zhàn)略

目前,金山辦公聚焦三個方向的產品體驗,內容創(chuàng)作(AIGC)、智慧助理(Copilot)知識洞察(Insight),在這個基礎上形成產品服務。

據了解,利用AI的能力改造產品,這也將是金山辦公未來幾年最核心的戰(zhàn)略,全力推進辦公新質生產力落地。

供給端:如何讓中文AI發(fā)展更長遠

從中長期發(fā)展來考慮,中文AI要想加快形成新質生產力,已經面臨的挑戰(zhàn)和機會是什么?

以最新的一次AI“大考”來看,綜合媒體信息顯示,用國產大模型做高考卷,出現了“偏科”的現象,比如文科強、理科弱。但關于文科,閱卷老師表示,多數模型無法理解“本體”“喻體”“暗喻”等語文概念,寫作文不像寫作文,更像問答題。

談到提升中文AI的水平,姚冬認為,加大在供給端的投入,釋放更多高質量的中文語料用于模型訓練,使中文AI更準確,這樣有助于行業(yè)的持續(xù)創(chuàng)新,也對提升中文AI的全球影響力有深遠影響。

姚冬解釋到,模型訓練需要語料供應(語料簡單理解就是用于訓練人工智能的文本庫或數據集合,所形成的語料庫是AI訓練的基礎資源——編者注)?,F在全球范圍內,隨著算力規(guī)模的快速提升,用于模型訓練的語料資源有短缺的趨勢。從中國來看,中文AI再往前走,可能遇到的挑戰(zhàn),是高質量的中文語料供給缺乏。

中文AI的水庫里需要蓄力,持續(xù)加水。

綜合媒體報道信息稱,據國際數據公司(IDC)預測,中國數據量規(guī)模將從2022年的23.88ZB增長至2027年的76.6ZB,年均增長速度CAGR達到26.3%。但目前中文優(yōu)質數據仍然稀缺,如ChatGPT訓練數據里,中文資料比重不足千分之一。

許多高質量的中文語料沒有進入交易環(huán)節(jié),也就不會用于中文AI的模型訓練,因此,依托于中文AI的產品(服務)也就會遇到發(fā)展受限的瓶頸。這是中文AI加快形成新質生產力的現實挑戰(zhàn),也是創(chuàng)新數據要素交易模式,促進數據要素和實體經濟深度融合的機會。

責任編輯:王靜

熱門推薦