AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

新智元报道

编辑：LRST

【新智元导读】通过完全启用并发多块执行，支持任意专家数量（MAX_EXPERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，48 SGPRs），MoE Align & Sort逻辑被精心设计，实现了显著的性能提升：A100提升3倍，H200提升3倍，MI100提升10倍，MI300X/MI300A提升7倍...

MoE（Mixture of Experts）模型模仿了人脑的低功耗运作模式：功能被划分为多个独立的部分，在思考时通过自适应路由部分激活，从而提高计算效率。

牛津大学研究论文中的人脑皮层示意图，来源于互联网

首个可在CUDA真正可行的版本是Switch Transformer[1]，随后通过循环利用(Up Cycling)稠密模型Mistral[2]进一步优化了该设计。

SwitchTransformer-MoE

随后，DeepSeek V2/V3/R1[3][4][5]通过引入共享专家[3]和门控偏差（gating bias）[4][5]进一步改进了MoE，最终实现了无辅助损失（auxiliary loss free）的MoE模型 [4][5]。这一优化本质上归因于一个关键事实：当使用共享专家（DeepSeek团队选择的值为1）时，可以通过在较大的专家池（256个上施加偏差分数的惩罚，从而缓解专家路由的不均衡问题[11]。

MoE层本质上是由多个专家前馈网络（FFN）组成的层，其中包含门控函数（gating functions），用于根据Top-K门控分数（DeepSeek V3/R1中引入偏差）进行激活路由，并在所选的FFN层上通过Group GEMM计算logits。

该功能在很大程度上依赖于基数排序（radix sort）逻辑。借助MoE Align & Sort，机器学习研究人员和实践者可以按照专家ID对tokens进行排序。

在某些应用中，例如TransformerEngine[6][7]，该操作最初是通过已废弃的cub::DeviceRadixSort实现的，而增加的permute操作用于记录源（左）到目标（右）的映射，其梯度操作为unpermute。

MoE Permute示例

尽管cub::DeviceRadixSort大量使用共享内存，相比于基于__shfl_xor_sync（仅使用线程本地内存）的实现略慢，但它不支持对齐排序（alignment sorting）。

对齐排序对于Group GEMM的效率至关重要，因为它允许专家以块（block 为单位处理tokens。

SGLang 中的MoE Align & Sort算法采用了对齐排序，但在支持多达256个专家的大规模prefill操作时效率并不理想。该问题已在issue#2732中被确认。

目前的实现将MoE Align & Sort拆分为两个kernel启动（kernel launches）：

对齐（alignment）：在单个block内执行传统基数排序算法对齐后的偏移计算（alignment-based offsets computation）;

相关推荐：ZoZσZσZσ女人极品另类 lisa裸体图奶头走光图福利姬

分享： 2025-04-06 22:52:40 共81款

电脑

国产男女无套✅在线播放 481.20MB / 电视版下载 2024-10-23

查看详情

泄密偷拍妇产科视频
白鹿裸乳被爆白浆的漫画 2.52MB / 最新版下载 2024-10-23

查看详情

舒淇一级A片巜色情荒野
女人与公豬交高清视频 668.16MB / app下载 2024-10-23

查看详情

无码熟妇人妻av久久久一区二区
性少妇XXXⅩXXXA片 862.24MB / 官方版下载 2025-03-04

查看详情

我的女儿小丹第2部分阅读小说
🔞🍌进🍑里❌❌❌片 2.41MB / 完整版下载 2025-03-20

查看详情

十八禁🔞打屁股🍑网站
那个纹黑桃♠️ROXY推特账号 2.17MB / 手机版下载 2024-09-27

查看详情

猛男GayGay✅亚洲网站
男男+纯肉+超H污黄短篇段 2.37MB / 中文版下载 2025-01-03

查看详情

🍌伸进🍑视频

安卓

女学生❌❌出水网站 2.84MB / 2025官方最新版本下载 2025-03-06

查看详情

黄油菠萝包女忍的修炼技巧是
PornJAV✅japan 314.16MB / app下载 2024-10-23

查看详情

脱了小乔裙子玩小乔下面
男男㊙️无套 453.5MB / 官方版下载 2025-02-15

查看详情

免费➕精品➕国产37在线
日韩裸体裸乳🍑免费看软件 256.13MB / 完整版下载 2024-10-18

查看详情

▇榴莲视频▇无码免费下载
班长❌开腿让我爽一夜动漫无码 1.44MB / 最新版下载 2024-12-13

查看详情

夸克在线观看免费高清电视
国产美女被爽到高潮免费A片软件 2.53MB / 完整版下载 2024-10-12

查看详情

动漫美女裸体❌❌网站梅花13
女被❌到爽🔞巨乳漫画 751.12MB / 安装包下载 2025-03-11

查看详情

赵露思裸被❌视频
动漫被到爽流奶单人直播 413.14MB / 完整版下载 2024-10-08

查看详情

欧美XXXX83D
同性男男黄Gary片免费有腹肌 2.69MB / app下载 2024-10-30

查看详情

年下哭着含奶顶h
农村裸体帅老头GAYTV 1.14MB / 下载官方版 2025-03-04

查看详情

裸体🈲️网站
🍓导航入口㊙️国产潘甜甜 474.7MB / 官方版下载 2024-09-28

查看详情

男男gv
成人性做爰全过程免费 945.19MB / 完整版下载 2024-02-26

查看详情

刘亦菲啪啪婬荡舒服明星换脸
99精产国品一二三产区区别视频 731.17MB / app下载 2024-04-18

查看详情

奇优影院❤手机在线
❤国产精品嫩草影院88AV00 594.13MB / 最新版下载 2024-09-14

查看详情

FC2PPV个人撮影88AV
女人扒开🍑男生摸完整版 844.3MB / 最新版下载 2024-02-02

查看详情

加qq聊骚号2024
tube 69HDXXXXX欧洲 468.28MB / 安装包下载 2025-03-26

查看详情

杨幂穿JK被躁了一晚上
老爷趴在两腿中间吸我奶头视频 275.9MB / 电视版下载 2024-07-29

查看详情

美女裸露撒尿秘网站
女警察被❌吸乳羞羞 2.42MB / 2025官方最新版本下载 2024-01-17

查看详情

班长拉起胸让我的🍌伸进去动漫
120分钟做爰免费视频 928.10MB / 电视版下载 2024-01-11

查看详情

女人C交Z0OZ0OZXXV
美乃雀演过的全部电影 1.64MB / 电脑版下载「含模拟器」 2024-01-09

查看详情

二次元男裸体❌开腿P图
扒开🐻让我❌❌❌动 799.2MB / 电视版下载 2024-01-05

查看详情

一夜强开二女处苞的最新版本
女警猜拳3内置MOD修改器 2.25MB / 官方版下载 2025-02-14

查看详情

公车上双乳被两男人夹击电影
美女隐私黄㊙️www漫画 174KB / v1.0 安卓版 2024-01-04

查看详情

激烈吮乳吃奶头视频
永久免费漫画网站 2.13MB / 安装包下载 2024-01-02

查看详情

杨超越走光视频
捂尿内裤丨VK视频 1.65MB / 最新版下载 2024-06-07

查看详情

中国无套毛片学生妺女
纯肉黄辣高H啪学生校园 639.19MB / 电视版下载 2023-12-01

查看详情

古力娜扎自慰❌❌喷水好爽
男男十八禁啪啪网站小蓝 807.4MB / 官方版下载 2024-10-16

查看详情

麻豆精品㊙️国产
美女裸露放屁㊙️网站 1.9MB / 电脑版下载「含模拟器」 2023-11-08

查看详情

猛男GayGay✅无套免费视频
💚奇优影院 ️三千收藏 1.34MB / 电视版下载 2023-11-04

查看详情

粗喘别蹭了我硬了h
伽罗被爆❌漫画AV羞羞视频 1.86MB / 完整版下载 2023-11-02

查看详情

刻晴的白色乳液狂飙
91女神高潮喷水在线观看 2.88MB / 2025官方最新版本下载 2025-03-10

查看详情

18c.mic.bit.jmcomicron.mic
人体做爰12姿势图片 1.48MB / 官方版下载 2023-11-01

查看详情

污APP
91糖心桥本香菜丝袜二区 1.5MB / 完整版下载 2023-10-30

查看详情

欧美同志GaYGAYS✅
老师❌狂揉下部❌动漫 1.95MB / app下载 2024-05-31

查看详情

小🐤🐤戳进🍑无遮挡视频
三角洲裸体㊙️无遮挡胸视频 928.23MB / 中文版下载 2023-10-27

查看详情

斗罗大陆的衣服宁荣荣
蓬莱山全部裸体写真集 1.60MB / app下载 2023-10-27

查看详情

女同二台不片18🈲在线观看漫画
美女搂着小奶头 881.28MB / 中文版下载 2023-10-26

查看详情

美女疯狂柔❌脱脱内内漫画
小🐤🐤戳进🍑无遮挡画面 771.12MB / 手机版下载 2023-10-26

查看详情

掀开老师的裙子❌狂揉❌视频
动漫男同被❌到爽🔞奶头 558.12MB / 下载官方版 2023-10-25

查看详情

动漫男❌差女www免费视频
怎么调小狗男人性格 415.1MB / 手机版下载 2024-03-29

查看详情

Porno94😍
火舞胸⋯啊⋯嗯～出奶了小说 633.7MB / 最新版下载 2023-09-28

查看详情

深夜福利XXOO动态图gif
他扒开我内裤强吻尿口吃乳液 2.41MB / 中文版下载 2023-09-19

查看详情

把小🐥🐥连伸进女人的🍑里
🔞无遮挡裸光屁屁打屁股校园 1.22MB / PC端下载 2023-09-18

查看详情

日韩裸体裸乳🍑不良视频
麻豆㊙️精品国产免费 144.24MB / 安装包下载 2023-09-15

查看详情

柳神国漫3Dmax
ie炒菜免费网站入口 1.72MB / 中文版下载 2023-08-24

查看详情

少萝被❌脱脱内内做运动
国产性猛交XX乱下载下载 864.16MB / 最新版下载 2023-08-21

查看详情

约尔同人18❌AV黄漫
国产做受❌❌4777视频 1.38MB / app下载 2023-08-10

查看详情

ceкес日本видео
成人免费A片747474网址 923.25MB / 电视版下载 2023-08-08

查看详情

FreeeXXX性HD丝袜69
女同被❌到爽了玩具 1.54MB / 电脑版下载「含模拟器」 2023-08-04

查看详情

女朋友脱了衣服让❌了一夜小说
男人把自己的qq放在女人的qq视频动漫头像 937.5MB / app下载 2024-11-08

查看详情

班长被❌到爽🔞流电影
荒野乱斗裸乳被爆❌白浆的软件 1.54MB / 安装包下载 2023-07-31

查看详情

粗大的🐔巴再里面进进出出网站
貂蝉3D同人18❌羞羞漫画 1.86MB / 安装包下载 2023-07-20

查看详情

500部大龄熟乱视频
免费➕无码➕国产成年白嫩精品 686.30MB / 2025官方最新版本下载 2023-07-20

查看详情

18🈲🍆🍑无套直导航视频
91♥️丨PORNY丨成人 1.39MB / 电视版下载 2023-07-10

查看详情

妺妺穿白丝忍不住c了的作文
免费㊙️羞羞视频入口 2.10MB / 下载官方版 2023-06-14

查看详情

爽好紧宝贝别夹叫大视频
韩漫无羞遮无删减漫免费隔壁的她 2.34MB / 安装包下载 2023-06-06

查看详情

老头吃奶性行交视频
别告诉妈妈mama99更新 1.2MB / 官方版下载 2023-06-01

查看详情

紫悦同人18禁本子
流氓把🍌伸进美女🍑 217.5MB / 2025官方最新版本下载 2023-06-05

查看详情

男男憋尿按压小腹肚子不让尿
暴躁老妈46集 1.04G / v8.2.2 安卓版 2024-08-13

查看详情

开腿爆❌乳液狂飙游戏
国产黃色A片三級三級三級狼狈 1.14MB / PC端下载 2023-05-19

查看详情

毛利兰全彩h本
男人女人40分钟完成喷水下载 1.72MB / 电脑版下载「含模拟器」 2024-06-19

查看详情

海贼王女帝被爆❌羞羞歪漫
🈲18🈲🈲🈲无码视频 388.10MB / 电视版下载 2023-04-26

查看详情

欧美性猛交 XXXX 乱大交
沙奈朵同人18❌在线观看 2.12MB / 下载官方版 2023-04-24

查看详情

刘亦菲张开腿做爰视频
动漫老师裸体被❌涩涩视频 1.9MB / 下载官方版 2023-04-20

查看详情

欧美做受❌❌❌喷浆在线观看
国产淫穴淫妻 428.13MB / 电脑版下载「含模拟器」 2023-04-24

查看详情

汉库克调教本子
李沁被强奷到高潮喷水小说 1.18MB / 电视版下载 2023-03-28

查看详情

女女les做爰XXOO网站
女人张开双腿涩涩㊙️ 452.9MB / 电脑版下载「含模拟器」 2024-12-02

查看详情

欧美《交换做爰》
纳西妲被扒开腿坐做❌同人 1.21MB / 下载官方版 2024-08-12

查看详情

prouhnb站破解免费版
14🈲️小泬喷白浆流在线观看 697.20MB / 最新版下载 2023-03-14

查看详情

八尺大人被❌吸乳视漫画
🔞捆绑无遮挡打光屁股图片 789.8MB / 完整版下载 2023-01-17

查看详情

文轩河马的秘密河信息素抑制剂
八尺大人裸体被❌涩涩 495.8MB / app下载 2024-04-03

查看详情

古董商裸体被❌涩涩
x52登录入口 853.15MB / app下载 2023-02-13

查看详情

女人扒开🍑男生摸
3D云缨被疯狂吸乳 2.27MB / 2025官方最新版本下载 2023-03-03

查看详情

椰子视频8.11版本
七海千秋被❌自慰爽死 645.8MB / PC端下载 2023-08-29

查看详情

日本肉体βββββββ肉交400

bc贷

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

电脑

安卓

苹果