中國移動發布《審計行業大模型評測白皮書》及配套測試集,為審計大模型建立“度量衡”
飛象網訊 10月11日,在2025中國移動全球合作伙伴大會上,中國移動正式發布《審計行業大模型評測體系白皮書》(以下簡稱《白皮書》)及配套測試集。作為國內首個面向審計行業的系統性大模型評測標準框架,該體系為審計大模型的科學評估、選型與應用筑牢了“標準底座”, 有效填補了通用大模型評測體系在審計行業適配性與應用價值評估上的空白。

《白皮書》指出,審計行業大模型作為融合前沿技術的創新產物,正在逐漸重塑審計業務的流程與模式,其在提升審計效率、增強風險識別、助力精準決策 等方面展現出巨大潛力。然而,隨著審計領域各類大模型的不斷涌現,其質量與性能參差不齊,如何科學、客觀且全面地評測審計行業大模型就顯得尤為重要。現有通用大模型評測側重于文本流暢性與開放任務泛化能力,難以量化審計場景特定需求,在數據、方法和落地上面臨三重鴻溝。
為深度洞察不同審計行業大模型的專業適配性與實際效能,精準辨析各模型的優勢與短板,推動審計行業大模型技術健康發展,中國移動依據國家標準 GB/T45288.2-2025《人工智能大模型第 2 部分:評測指標與方法》,并結合中國移動聯合發布的《通用大模型評測標準》,編制完成《審計行業大模型評測體系白皮書》,創新性地提出面向審計行業的大模型評測體系,以“2+4+6”層級架構為核心:聚焦基礎能力層與審計應用層“兩大”核心場景,并將審計應用評測按審計流程細分為不同場景下的30余項具體應用任務。針對每項審計應用任務,白皮書清晰指明適用的評測方式、指標、數據與工具“四項”關鍵評測要素,同時細化反映功能性、準確性、可靠性等“六大”審計評測維度的具體指標,為評測工作提供了切實可行的落地級指南,有效彌補了通用評測在審計行業適配性與應用價值評估上的不足。
此外,中國移動還同步發布了與《白皮書》配套的標準化的專業測試集,包含國家權威審計類考試題目2萬余條,及覆蓋企業審計業務六大場景的真實數據5千余條,為模型能力評估提供了真實、全面的數據支撐。
《白皮書》及測試集的發布推動審計行業大模型的發展邁入了更加標準化、規范化的新階段。未來,中國移動將持續推動大模型安全、透明、高效地賦能審計現代化,鑄就“科技強審”新范式,鑄牢審計之盾。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
5G-A賦能機器人火炬接力:中國移動以技術革新點亮全運科技盛宴
2025年11月,第十五屆全國運動會將在粵港澳三地盛大啟幕。這場賽事不僅是體育健兒的競技場,更是前沿科技落地應用的“試驗田”。其中,11月2日的機器人火炬接力作為本次全運會的核心創新亮點..[詳細]
輕薄機型出師未捷身先死,長使業績淚滿襟
當iPhone Air宣布上市當天,隨著各路評測內容解禁,一個顯眼的標題也隨之出現,那就是“注定停產”。輕薄機型的出現一方面讓人們看到廠商正在挖掘全新市場空間,另一方面也勾起了小尺寸機型..[詳細]
智能未來:宇宙為你閃爍
未來十年,你家的電表可能再也不用換電池,自動駕駛汽車能"看到"幾公里外的路況,甚至海洋深處的傳感器都能實時傳回數據。這些不是科幻,而是剛剛在無錫物博會上發布的《2025全球..[詳細]
智能IP廣域網成為筑牢智算產業發展根基的關鍵一環
隨著國家加速推動智算產業高質量發展,網絡支撐能力已成為產業進階的核心抓手,而作為關鍵基礎設施的智能IP廣域網,正憑借其在算力調度、數據傳輸中的核心作用,成為筑牢智算產業發展根基的..[詳細]
大中華區市場失守 蘋果寄望AI驅動未來增長
蘋果公司公布的2025 財年第四季度財報呈現“冰火兩重天”態勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區卻成..[詳細]













