老鸭窝av在线_午夜视频在线观_婷婷六月国产精品久久不卡_亚洲AV成人无码网站天堂久久_亚洲欧美激情四射在线日_麻豆视频在线播放_亚洲一区美女_一本一本久久a久久综合精品_国产一级久久久_欧美大电影免费观看

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

大模型新趨勢之MoE:現狀、挑戰及研究方向

2024年11月4日 07:19  天翼智庫  

2024年,全球主流企業加快推出MoE大模型,1-5月發布千億以上大模型均采用MoE優化架構,且數量超過近三年總和。MoE大模型架構憑借平衡大模型訓推成本和計算效率等優勢,更適合處理大規模數據和復雜任務,已成谷歌、OpenAI、阿里、騰訊等企業控制成本、提升模型性能、應對大模型“價格戰”的新方向。

MoE的內涵、優勢、發展歷程及主要玩家

MoE(Mixture of Experts,混合專家模型)是一種用于提升深度學習模型性能和效率的技術架構。其主要由一組專家模型和一個門控模型組成,核心思想是在處理任務時只激活部分專家模型,并通過門控模型控制專家模型的選擇和加權混合。簡言之,MoE在訓練過程通過門控模型實現“因材施教”,進而在推理過程實現專家模型之間的“博采眾長”。

圖1 MoE架構原理示意圖1

MoE的特征優勢是專家化、動態化、稀疏化,在模型研發成本、訓練/推理效率和整體性能之間實現最佳平衡。一是采用混合專家方法,各專家模型面向不同數據或任務進行針對性建模和處理,提升模型的準確性和專業能力,更好地適應多模態數據及復雜/特定任務計算。二是根據任務的需求靈活選擇并組合適宜的專家模型,使得模型能夠動態地適應不同的輸入樣本和任務場景,提高模型的靈活性、可解釋性和表達能力。三是只激活或使用部分專家模型,減少不必要的計算,提升模型計算速度并降低算力需求。研究表明,與稠密模型相比,MoE+指令調優僅使用1/3算力就能提升大模型性能約45%,縮短訓練時間2,且參數規模越大,效果越好。

MoE不是一種全新的技術,與Transformer融合邁過發展“拐點”。早期MoE主要作為一種集成學習方法,用于提升模型預測性能,如谷歌將MoE引入自然語言處理領域,提升機器翻譯性能。2020年,谷歌Gshard首次將MoE引入Transformer構建分布式并行計算架構,打開MoE發展新思路。之后,MoE逐漸進入規模發展階段,作為一種底層架構優化方法,與Transformer結合,陸續被用于推薦系統、自然語言處理、計算機視覺、多模態大模型等領域。

圖2 MoE模型發展歷程

基于Transformer的MoE已成大模型主流架構,國內外主流企業差異化推進MoE大模型布局和落地。2024年,全球MoE大模型數量呈爆發增長態勢。據公開統計,2024年1-5月全球發布MoE大模型數量約20個,超2021-2023三年總量(約10個),且以多模態大模型為主(占比約90%)。谷歌、OpenAI、阿里、華為、騰訊等大型企業側重利用MoE提升大模型性能和實用性。而Mistral AI、昆侖萬維、MiniMax、幻方量化等初創企業側重利用MoE低成本優勢搶占AI市場。

表1 部分公司MoE大模型布局及發布情況

MoE發展仍面臨挑戰

 1.訓練和微調面臨穩定性和可靠性挑戰。

訓練階段,MoE通過“條件計算”思想引入稀疏性,其將token分配給固定數量專家的離散特性帶來專家負載均衡問題,容易導致某些專家被過度利用,而其他專家未被充分利用,從而影響專家的專業化,降低模型性能。雖然這一問題,目前可以通過合并輔助損失函數等來緩解,但仍會導致模型訓練不穩定。微調階段,與稠密模型相比,稀疏模型的微調更容易產生過擬合問題,容易導致泛化能力不足,影響模型整體性能,如擁有1.6T參數量的MoE預訓練模型Switch Transformer,在SuperGLUE等常見基準上進行微調時,其整體性能卻落后于較小的模型3。

 2.大規模分布式部署難且通信成本高。

一方面,盡管MoE可以在模型參數總量不變的情況下降低計算需求,但仍需要將所有參數加載到內存中。因此,MoE對內存需求很高,需要將超大規模參數模型的專家層分別部署在不同設備以減少內存消耗,實際部署難度很大。另一方面,隨著MoE模型的參數規模/復雜度不斷提升,模型訓練期間的高效通信越來越重要。而模型復雜度與通信開銷之間的權衡一直是分布式訓練的重大問題4。MoE模型中專家之間的數據交換、并行訓練都需要機間all-to-all通信來實現,增加通信成本,且模型規模越大,通信成本越高。因此,在實際部署過程中,需要仔細設計通信策略和優化網絡拓撲,降低通信延遲和潛在的網絡擁塞。

 3.MoE架構存在原始缺陷、與現有架構集成難,部分關鍵技術仍有待攻關。

一是MoE仍存在知識混合、知識冗余等原始架構缺陷,容易導致專家同質化嚴重、專業化能力不足等問題。同時,根植于MoE的超參數調整、專家模型設計及協作、動態性適應數據變化、對數據噪聲相對敏感等技術難題仍有待解決。二是MoE架構設計很復雜,涉及網絡類型、專家數量選擇等多個方面。目前FFN、LSTM、CNN、Attention和LoRA等多種網絡架構已被用作專家模型,但各種網絡類型專家混合仍屬于新興研究領域。三是將MoE集成到現有模型框架中對于降低現有模型升級成本、推進MoE廣泛應用至關重要,但可能會損害模型性能,需要進一步優化并行預訓練和推理策略。

MoE未來重點研究方向

 1.通過優化MoE架構、改進門控算法等,提高模型性能和穩定性。

一是業界正在加快研發各種新型MoE架構,以提升模型性能或實用性。如清華和微軟聯合提出MH-MoE5,通過多頭機制彌補MoE原始缺陷,實現專家激活率由8.33%提升至90.71% ,提升模型高效擴展能力;華為提出全新LocMoE架構,并將其嵌入盤古大模型,提升模型通用性、可解釋性和易移植性等。二是多項研究表明,通過改進門控算法或調整訓練策略,能有效提升MoE模型穩定性及性能,如AdvMoE通過算法優化將門控模型和專家模型分開訓練,顯著提高MoE模型的對抗魯棒性和整體效率6;普林斯頓大學和Meta AI聯合提出一種Lory方法,引入因果分段路由策略和基于相似性的數據批處理技術,提升了模型的效率和專家專業化能力7。

 2.構建分布式訓練系統/軟件工具,提升MoE模型訓練效率、降低訓練門檻。

清華團隊發布FastMoE、FasterMoE、SmartMoE3等一系列分布式訓練系統,相比直接使用PyTorch,FastMoE可將訓練速度提升47倍;SmartMoE支持一鍵實現MoE模型分布式訓練,并優化模型訓練性能。微軟的DeepSpeed9系統提供端到端MoE訓練和推理解決方案,結合模型壓縮等技術,可提供更快、更便宜的MoE模型推理服務,與同等質量的密集模型相比,可加速4.5倍,成本降低9倍。斯坦福大學、微軟和谷歌聯合推出的MegaBlocks系統,面向單個GPU上運行多個專家的場景,提升MoE訓練效率,與最先進的Tutel庫相比,端到端訓練速度提升40%。

 3.利用模型蒸餾、硬件優化等技術,降低MoE模型部署難度。

一是通過模型蒸餾、任務級別路由等技術,保留模型性能同時降低模型復雜度。谷歌將Switch Transformer蒸餾回其對應的稠密模型,參數規模降低95%,成功保留了約30-40%的由稀疏性帶來的性能提升,加快了預訓練速度,且在推理過程中支持使用更小的模型。此外,通過任務級別路由技術將整個句子或任務直接路由到一個專家上面,或提取出用于特定服務的子網絡,有助于簡化模型結構。二是研究更適合稀疏計算的硬件優化技術,節省內存、加速計算。研究表明,塊稀疏Flash Attention注意力機制可以進一步減少GPU內存訪問次數,加快計算并節省顯存;結合PagedAttention構建vLLM11(一種LLM推理加速系統),可實現KV緩存零浪費且支持各請求間共享KV緩存,從而降低內存使用,并實現高效內存管理。

 4.通過系統性優化、共享專家、通信結構設計等,降低通信成本。

一是通過系統性優化,平衡模型復雜度與通信開銷,如ScMoE12使用一種通信重疊并行策略,克服分布式MoE模型中通信操作的固有依賴性對并行優化的阻礙,實現11%的訓練速度提升、15%的推理速度提升,且通信時間僅為8×A800-NVLink場景中標準MoE的15%。二是利用共享專家方法,減少分布式系統之間的數據傳輸,如DeepSeekMoE13采用共享專家、細顆粒度專家分割等策略,可有效解決MoE中的參數冗余、路由崩潰等問題,且在145B參數下,僅需約28.5%的計算量即可達到DeepSeek 67B的性能水平。三是通過通信結構設計,提升通信效率,如SCoMoE通過結構化全連接通信,鼓勵數據跨設備通信,結合標記聚類方法,提升了模型性能和效率。

結語

MoE為企業帶來平衡算力成本和計算效率、加快萬億/十萬億模型參數規模擴展、提升大模型實用性等機遇,但也帶來關鍵技術攻關、大規模工程部署、網絡拓撲優化等挑戰。未來應持續探索MoE架構設計、相關算法及策略改進、軟硬件協同優化等技術,加快推動MoE模型研發和業務賦能。同時,結合MOE模型分布式部署,探索千億/萬億參數規模大模型跨數據中心分布式訓練試點驗證。

注釋

1.來源:論文《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer》

2.參考論文:《Mixture-of-Experts Meets Instruction Tuning: A Winning Combination for Large Language Models》

3.參考論文:《St-moe: Designing stable and transferable sparse expert models》

4.參考論文:《Gshard: Scaling giant models with conditional computation and automatic sharding》

5.參考論文:《Multi-Head Mixture-of-Experts》

6.參考論文:《Robust Mixture-of-Expert Training for Convolutional Neural Networks》

7.參考論文:《Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training》

8.參考論文:《SMARTMoE: Effciently Training Sparsely-Activated Models through Combining Offine and Online Parallelization》

9.參考論文:《DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale》

10.參考論文:《Flashattention: Fast and memory-efficient exact attention with io-awareness》

11.參考論文:《Efficient Memory Management for Large Language Model Serving with PagedAttention》

12.參考論文:《Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts.》

13.參考論文:《Deepspeed-moe: Advancing mixture-of-experts inference and training to power next-generation ai scale.》

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
愛立信中國區總裁方迎:新質網絡創造新質價值
精彩專題
2024中國算力大會
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
久久国产加勒比精品无码| 玖玖精品国产| 国产卡一卡二卡三| 国产视频xxxx| 香蕉视频在线免费| 久草精品视频| 国产aⅴ综合色| 精品少妇一区二区三区在线视频| 欧美一级大胆视频| 99久久激情视频| 欧美日韩精品区| 天天色天天色| 久久99精品久久久野外观看| 国产精品538一区二区在线| 在线播放/欧美激情| 成人黄色片在线| 国产a级黄色片| 四虎www视频| 婷婷午夜社区一区| 可以在线观看的av网站| 高清精品xnxxcom| 欧美国产视频在线| 久久久精品欧美| 亚洲精品电影在线观看| 影音先锋日韩有码| 好吊色视频988gao在线观看| www青青草原| 国产在线制服美女| 三级全黄做爰视频| 福利在线网站| 一区二区美女| 亚洲综合av网| 成人xxxxx色| 日韩精品视频免费播放| 亚洲第一区视频| 99视频在线精品国自产拍免费观看| 欧美自拍丝袜亚洲| 亚州欧美一区三区三区在线| 国产一级生活片| 欧美3p视频在线观看| 亚洲国产一区二区三区a毛片| 欧美性xxxx| 精品国产乱码久久久久久108| 麻豆天美蜜桃91| 最新在线观看av| 国产精品www.| 亚洲美女av在线播放| 日韩中文字幕三区| 亚洲天堂久久久| av资源一区| 91美女在线观看| 日韩美女在线观看| 国产传媒在线看| 日韩美女一级视频| 久久精品国产**网站演员| 久久久成人精品| 亚洲精品乱码久久久久久蜜桃图片| 少妇bbw搡bbbb搡bbbb| 第一sis亚洲原创| 亚洲国产精品va在看黑人| 福利在线一区二区三区| 日本精品999| 欧美视频二区欧美影视| 日韩欧美亚洲综合| 国产真人做爰毛片视频直播| 欧美日韩综合高清一区二区| 九九视频精品全部免费播放| 777奇米四色成人影色区| 国产极品尤物在线| 夜夜爽视频导航| 国内精品亚洲| 久久久久国产一区二区三区| 永久免费看片视频教学| 色呦呦在线视频| 亚洲私人黄色宅男| 亚洲国产精品女人| www.91视频.com| 一区二区三区高清视频在线观看| 久久天天躁日日躁| 激情五月婷婷在线| 无人区在线高清完整免费版 一区二| 亚洲欧美综合在线精品| 一级黄色片播放| 女生裸体视频网站免费观看| 国产精品视频一区二区久久| 综合久久婷婷| 久久久久久国产精品久久| 久久久精品人妻一区二区三区四| 欧美gv在线| 精品视频一区 二区 三区| 国产成人精品综合久久久久99 | 91九色蝌蚪porny| 成人av福利| 在线一区二区观看| 亚洲熟女一区二区| 女人黄色免费在线观看| 在线一区二区视频| 成年人网站大全| 黄色在线播放| 亚洲一区二区偷拍精品| 免费av不卡在线| 黄色大片在线播放| 欧美日本在线一区| 欧美xxxooo| 国产精品极品在线观看| 久久夜色撩人精品| 亚洲影视一区二区| 精品999网站| 99久热re在线精品视频| 成人免费视频网站在线看| 97精品电影院| av免费网站观看| heyzo在线播放| 日韩国产精品视频| 久久国产香蕉视频| 欧美体内she精视频在线观看| 亚洲永久在线观看| xxx电影网| 一区二区三区四区在线播放| 一边摸一边做爽的视频17国产| xxxxxx欧美| 国内久久久精品| 人善交vide欧美| 国产精品久久久一本精品 | 国产激情视频在线看| 中文国产成人精品| 丰满熟妇乱又伦| 国产激情视频一区二区在线观看| 超碰在线免费观看97| 91ph在线| 久久久国产成人精品| 国精产品一品二品国精品69xx | 51xx午夜影福利| aaa在线免费观看| 亚洲无限av看| 性高潮久久久久久久久久| 91蜜桃免费观看视频| 久久精品女同亚洲女同13| 色悠久久久久综合先锋影音下载| 日韩av片电影专区| 国产a级网站| 日韩欧美中文字幕精品| 黄色片视频免费观看| 亚洲AV无码成人精品区东京热| 亚洲一级淫片| 波多野结衣三级在线| sm性调教片在线观看| 九九热这里只有在线精品视| 免费吸乳羞羞网站视频| 色婷婷久久久综合中文字幕| 日本中文字幕在线观看视频| 国产91高潮流白浆在线麻豆 | 亚洲欧洲日韩综合二区| 黄页在线观看免费| 欧美一级bbbbb性bbbb喷潮片| av在线影视| 亚洲国产精品va| 免费三级毛片| 日韩av一区在线| 国产精品综合久久久久| 777午夜精品免费视频| 黄片毛片在线看| 午夜精品免费在线观看| 精品黑人一区二区三区国语馆| 国产日韩精品一区二区三区 | 99re6在线观看| 视频欧美一区| 福利网在线观看| 成人日韩视频| 国产精品videossex国产高清| 国产精品毛片视频| 国产精品入口芒果| 成人在线免费观看91| 91日韩精品视频| 亚洲毛片在线| 国产特级黄色录像| 国产电影一区二区三区| 精品无码m3u8在线观看| 久久久不卡影院| 中文字幕av影视| 欧美日韩国产在线播放| 爱福利一区二区| 精品日韩欧美一区二区| www.青青草.com| 性欧美办公室18xxxxhd| av在线日韩国产精品| av免费精品一区二区三区| 日韩av懂色| 日韩国产一级片| 在线看片一区| 小早川怜子一区二区的演员表| 成人av网站免费观看| 一区二区精品视频在线观看| 色综合久久中文字幕| 色视频免费在线| 97视频在线看| 美女福利一区二区 | 久久免费观看视频| 中文在线字幕免费观看| 婷婷视频在线播放| 欧美疯狂party性派对| 国产成人精品视频ⅴa片软件竹菊| 日韩一区二区久久| 一级片一级片一级片| 亚洲一级不卡视频| 免费毛片观看| 国产精品三级美女白浆呻吟| www国产精品| 91久久免费视频| 超碰人人在线| 日本高清久久天堂| av成人亚洲| 国产精品igao网网址不卡| 国产99久久精品| 亚洲 欧美 精品| 久久网福利资源网站| 欧美sm一区| 国产精品91av| 亚洲女爱视频在线| 成人蜜桃视频网站网址| 国产精品毛片va一区二区三区| 欧美mv日韩| 中文字幕第三页| 国产午夜一区二区| 日本午夜免费一区二区| 亚洲人人夜夜澡人人爽| 福利视频导航一区| 男人av在线| 无码专区aaaaaa免费视频| 成人一区二区三区中文字幕| 91专区视频| 麻豆传媒一区二区| 国产一区二区福利视频| 欧美日本另类xxx乱大交| 国产精品国产福利国产秒拍| 欧美一区电影| 中文字幕一区二区三区四区免费看| 精品国产91亚洲一区二区三区婷婷| 成年网站在线视频网站| 中文字幕一区二区三区人妻在线视频 | 国内精品在线视频| wwwwww.色| 亚洲日本护士毛茸茸| 中文视频在线| 免费国产成人av| 亚洲va在线va天堂| 久草资源在线观看| av网站免费在线看| 亚洲精品按摩视频| 超碰97久久国产精品牛牛| 成人精品在线看| 久久久免费精品| 精品动漫av| 日本黄色免费| 黄色一级大片免费| 亚洲日本一区二区三区| av午夜在线| 最新中文字幕av| 深夜福利一区二区| 亚洲国产一成人久久精品| 亚洲最大最好的私人影剧院| 国外成人免费视频| 国产亚洲制服色| dy888亚洲精品一区二区三区| 亚洲第一黄色网址| 国产亚洲精品久久久久久牛牛| 中文精品一区二区| 午夜国产一级| 亚洲 欧美 综合 另类 中字| 欧美日韩国产丝袜另类| 福利一区三区| 天堂av手机版| 成人在线免费观看视频网站| 丰满岳妇乱一区二区三区| 日韩精品第一| 国产探花精品一区二区| 极品日韩久久| 亚洲成人在线网站| 国产999精品在线观看| 午夜精品无码一区二区三区| 亚洲天堂电影网| 欧美日韩中文字幕精品| 在线观看视频一区二区三区| 一区二区视频在线观看免费的| 91九色精品视频| 日韩高清在线观看| 亚洲欧美激情另类| 91影院在线免费观看| 国产大学生校花援交在线播放| 特级西西www444人体聚色 | 欧美国产精品一区二区| 97天天综合网| www香蕉视频| 成人黄色激情网| 亚洲影视在线观看| 成人精品动漫一区二区三区| 91av视频| 国产精品无码在线| 成人a免费视频| 亚洲精品久久7777| 麻豆一区二区| 狠狠操五月天| 欧美xxxooo| 极品校花啪啪激情久久| 欧美精品日韩一本| 一区在线视频观看| 黄色成人在线观看| 亚洲av无码片一区二区三区| 亚洲 高清 成人 动漫| 久久精品免费电影| 亚洲国产精品精华液2区45| 久久99国产精品二区高清软件| 亚洲欧美另类色图| 91精品啪在线观看国产| 国产日本欧美一区二区三区| 亚洲在线一区二区三区| 久久久久亚洲| www.成人精品免费网站青椒| 天天射天天干天天| 日本三级免费网站| 欧洲精品在线视频| 精品色蜜蜜精品视频在线观看| 欧美午夜精品| 青春草视频在线观看| 国产美女在线看| 小泽玛利亚一区二区免费| 在线播放 亚洲| 最近2019免费中文字幕视频三| 久久久久久久性| 日韩影院二区| 国产91足控脚交在线观看| 91视频免费在线看| 欧美撒尿777hd撒尿| 久久久久久黄| 蜜桃麻豆av在线| av黄色免费| www香蕉视频| 网站免费在线观看| 成人手机在线播放| 欧美激情精品久久久久久蜜臀| 一区二区在线电影| 视频在线观看91| 欧美成人家庭影院| 日本免费一区二区三区最新| 日韩中文字幕观看| 任我爽在线视频| 不卡影院一区二区| 国产伦精品一区二区| 久久久精品久久久久| 欧美午夜精品久久久久久人妖| 国产精品 欧美精品| 中文字幕亚洲综合久久五月天色无吗'' | 日韩无码精品一区二区| 日本一区二区免费高清视频| 欧美在线一区二区视频| 精品免费一区二区三区| 国产亚洲欧美日韩日本| 麻豆精品网站| 成人看片爽爽爽| 超碰在线视屏| 在线视频专区| 国产成人精品久久一区二区小说| 日本韩国欧美中文字幕| 久久精品老司机| 国产美女三级视频| 中文视频一区视频二区视频三区| 国产91在线播放九色快色| 一区二区三区国产在线观看| 欧美网站一区二区| 亚洲精品日产精品乱码不卡| 欧美网站在线| 午夜影院欧美| 欧美福利在线播放网址导航| 日韩欧乱色一区二区三区在线| 国产精选在线| 无码精品一区二区三区在线| 91插插插插插插插插| 亚洲啊啊啊啊啊| 欧美一区二区在线| 99久re热视频这里只有精品6| 欧美激情中文网| 久久成人精品视频| 国产亚洲精品久久久久久777| 欧美大黄免费观看| 911精品产国品一二三产区| 日韩欧美中文字幕在线播放| 天天色综合成人网| 亚洲国产视频直播| 亚洲午夜精品网| 香蕉av福利精品导航| 日本韩国一区二区三区视频| 色婷婷av一区| 欧美福利视频导航| 日韩欧美一二区| 一区二区欧美激情| 欧美激情影音先锋| 国产精品欧美激情在线播放| 亚洲一区二区三| 精品国产一区二区三区四区vr | 亚洲jizzjizz妇女|