華為:AI推理創新技術UCM將于今年9月正式開源

8月12日晚間消息,在2025金融AI推理應用落地與發展論壇上,中國銀聯執行副總裁涂曉軍、華為數字金融軍團CEO曹沖出席并發表致辭。論壇上,華為公司副總裁、數據存儲產品線總裁周躍峰發布AI推理創新技術——UCM推理記憶數據管理器,旨在推動AI推理體驗升級,提升推理性價比,加速AI商業正循環。同時,華為攜手中國銀聯率先在金融典型場景開展UCM技術試點應用,并聯合發布智慧金融AI推理加速方案應用成果。
周躍峰在論壇上強調:“AI時代,模型訓練、推理效率與體驗的量綱都以Token數為表征,Token經濟已經到來”。為保障流暢的推理體驗,企業需持續加大算力投入,但如何在推理效率與成本之間找到最佳平衡點,成為了全行業亟待解決的重要課題。
為此,華為推出UCM推理記憶數據管理器,包括對接不同引擎與算力的推理引擎插件(Connector)、支持多級KV Cache管理及加速算法的功能庫(Accelerator)、高性能KV Cache存取適配器(Adapter)三大組件,通過推理框架、算力、存儲三層協同,實現AI推理“更優體驗、更低成本”。
在與中國銀聯的聯合創新技術試點中,UCM的技術價值得到驗證。在中國銀聯“客戶之聲”業務場景下,借助UCM技術及工程化手段,大模型推理速度提升125倍,僅需10秒即可精準識別客戶高頻問題,促進服務質量提升。未來,中國銀聯將依托國家人工智能應用中試基地,聯合華為等生態伙伴共建“AI+金融”示范應用,推動技術成果從“實驗室驗證”走向“規模化應用”。
論壇現場,華為正式公布了UCM開源計劃。UCM通過開放統一的南北向接口,可適配多類型推理引擎框架、算力及存儲系統。今年9月,UCM將正式開源,后續逐步貢獻給業界主流推理引擎社區,攜手全產業共同推動AI推理生態的繁榮發展。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
5G-A賦能機器人火炬接力:中國移動以技術革新點亮全運科技盛宴
2025年11月,第十五屆全國運動會將在粵港澳三地盛大啟幕。這場賽事不僅是體育健兒的競技場,更是前沿科技落地應用的“試驗田”。其中,11月2日的機器人火炬接力作為本次全運會的核心創新亮點..[詳細]
輕薄機型出師未捷身先死,長使業績淚滿襟
當iPhone Air宣布上市當天,隨著各路評測內容解禁,一個顯眼的標題也隨之出現,那就是“注定停產”。輕薄機型的出現一方面讓人們看到廠商正在挖掘全新市場空間,另一方面也勾起了小尺寸機型..[詳細]
智能未來:宇宙為你閃爍
未來十年,你家的電表可能再也不用換電池,自動駕駛汽車能"看到"幾公里外的路況,甚至海洋深處的傳感器都能實時傳回數據。這些不是科幻,而是剛剛在無錫物博會上發布的《2025全球..[詳細]
智能IP廣域網成為筑牢智算產業發展根基的關鍵一環
隨著國家加速推動智算產業高質量發展,網絡支撐能力已成為產業進階的核心抓手,而作為關鍵基礎設施的智能IP廣域網,正憑借其在算力調度、數據傳輸中的核心作用,成為筑牢智算產業發展根基的..[詳細]
大中華區市場失守 蘋果寄望AI驅動未來增長
蘋果公司公布的2025 財年第四季度財報呈現“冰火兩重天”態勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區卻成..[詳細]













