欧美本精品男人aⅴ天堂_亚洲精品久久久蜜桃_国产精品资源网_亚洲精品在线观看网站

您當前的位置 :創(chuàng)業(yè) >
聯想將單臺服務器運行大模型性能推向新高
2025-03-18 13:38:38   來源:中國經濟網  分享 分享到搜狐微博 分享到網易微博

近日,聯想宣布旗下首款AMD AI大模型訓練服務器聯想問天WA7785a G3在單機部署671B(滿血版) DeepSeek大模型時,可實現極限吞吐量6708token/s,將單臺服務器運行大模型的性能推向了新高。

據悉,依托聯想萬全異構智算平臺,聯想通過訪存優(yōu)化、顯存優(yōu)化、PCIe 5.0全互聯架構創(chuàng)新以及精選SGLang框架中性能最優(yōu)算子等諸多創(chuàng)新方式,對大模型從預訓練、后訓練到推理的全流程進行持續(xù)優(yōu)化,在單臺部署DeepSeek 671B大模型的聯想問天WA7785a G3上實測最高吞吐量達6708 token/s。

在模擬問題對話場景(上下文序列長度128/1K)時,最高可支持并發(fā)數158,TPOT 93毫秒, TTFT 2.01秒;而在模擬代碼生成(上下文序列長度512/4K )時,并發(fā)數可達140,TPOT 100毫秒, TTFT 5.53秒。意味著單臺聯想問天WA7785a G3可以支撐1500人規(guī)模企業(yè)的正常使用,是繼聯想問天WA7780 G3服務器單機部署滿血版DeepSeek大模型總吞吐量突破2500 token/s之后,單機部署該大模型推理性能的又一次突破。

此次突破是聯想中國基礎設施業(yè)務群、聯想研究院ICI實驗室和AMD聯合設計、協(xié)同調優(yōu)、共同實現的。此結果也并非最終結果,聯想與AMD還在持續(xù)嘗試深度調優(yōu)新方法,實現更高調優(yōu)突破。

關鍵詞:


[責任編輯:ruirui]





關于我們| 客服中心| 廣告服務| 建站服務| 聯系我們
 

中國焦點信息網 版權所有 滬ICP備2022005074號-20,未經授權,請勿轉載或建立鏡像,違者依法必究。
 

主站蜘蛛池模板: 亚洲欧洲精品在线| 亚洲综合五月天| 久久精品国产sm调教网站演员| 88国产精品欧美一区二区三区| 日本一区免费| 成人国产精品av| 久久av中文字幕| 日韩中文字幕网站| 亚洲综合日韩中文字幕v在线| 欧美日韩高清免费| 日韩精品一区二区三区外面| 国产精品久久久久久久久久免费| 日韩高清国产一区在线观看| 国产精品热视频| 久久久久久成人| 欧美欧美一区二区| 午夜精品一区二区三区在线| 国产精品露脸av在线| 国产欧美 在线欧美| 欧美专区国产专区| 97成人在线视频| 91久久精品国产| 国产一区二区视频在线免费观看| 久久精品国产免费观看| 免费一级特黄毛片| 国产日韩精品视频| 久久天天躁狠狠躁夜夜躁2014| 中文字幕免费在线不卡| 91久久精品在线| 91av在线播放| 91免费精品视频| 宅男在线精品国产免费观看 | 99精品免费在线观看| 高清av免费一区中文字幕| 国产精品久久网| 在线丝袜欧美日韩制服| 日本精品福利视频| 久久久久国产精品免费| 国产亚洲欧美一区二区三区| 国产美女被下药99| 五月婷婷综合色|