-
中國電信完成業(yè)界首個面向大模型推理的異構算力協同技術驗證
2025/10/21 16:09:41 來源:人民郵電報 【字體:大 中 小】【收藏本頁】【打印】【關閉】
核心提示:近期,中國電信研究院聯合北京智源人工智能研究院、昆侖芯科技有限公司、中興通訊、北京基流科技有限公司、中科加禾公司等產業(yè)合作伙伴,依托中國電信云網融合大科創(chuàng)裝置,完成業(yè)界首次近期,中國電信研究院聯合北京智源人工智能研究院、昆侖芯科技有限公司、中興通訊、北京基流科技有限公司、中科加禾公司等產業(yè)合作伙伴,依托中國電信云網融合大科創(chuàng)裝置,完成業(yè)界首次DeepSeek系列模型基于“英偉達算力+國產算力”交叉組合的異構PD分離推理試驗驗證,實現大模型推理集群的降本增效。
本試驗完成了面向大模型推理的異構算力協同技術針對6類典型場景的推理性能驗證,DeepSeek 671B模型在多種場景下實現推理集群總吞吐性能30%~72%的提升,并發(fā)能力提升2倍,同等吞吐條件下,異構算力組合推理成本下降最高達42%,真正實現“存量利舊”與“國產替代”的雙重目標。
針對推理Prefill與Decode階段特性優(yōu)化芯片設計逐漸成為行業(yè)共識,英偉達和華為分別發(fā)布芯片設計規(guī)劃,將PD兩階段分別適用“高算低存”和“低算高存”的思路融于芯片設計。中國電信研究院在2025年初洞察到PD分離推理對算力異質性的需求,構建異構通信優(yōu)化、PD資源調配、推理任務調度全棧自研異構混推體系,展現出三大核心優(yōu)勢:一是通過自研異構傳輸引擎,實現跨架構芯片PD池間KVCache的高效傳輸;二是采用自研國產算力賦能工具“翼芯”,根據業(yè)務特征與算力性能自動推薦并實時優(yōu)化PD資源配比;三是構建AI推理平臺,實現推理任務在Prefill池與Decode池間的動態(tài)調度。
技術驗證的成功體現了中國電信對智算推理優(yōu)化技術的深刻理解與對國產算力適配調優(yōu)的實踐創(chuàng)新,彰顯了中國電信作為算力基礎設施建設方推動國產算力從“可用”到“好用”的央企擔當。未來,中國電信將持續(xù)深化國產算力高質量發(fā)展布局,面向大模型訓推一體、多智能體系統打造“互聯互通、高效協同”的異構算力生態(tài)格局,推動新型信息基礎設施協調發(fā)展。(記者 翼研)
轉自:人民郵電報
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,郵箱:cidr@chinaidr.com。- 熱點資訊
- 24小時
- 周排行
- 月排行
- 當“國際慢城”邂逅“快趣活力”:萬達美華酒店為南京高淳注入旅居新想象
- 雙湖之約,古今對話:萬達生活方式酒店深耕文旅融合新路徑
- 俄羅斯對華免簽催熱跨境游 旅游平臺赴俄機票搜索量激增
- 以AI為鑰,以生態(tài)為橋:思特奇賦能運營商數智化躍遷
- 多部門部署加強數據要素學科專業(yè)建設和數字人才隊伍建設
- “修煉內功”留住游客 “文化惠民”助力文化保護與城市發(fā)展實現雙贏
- 以革新破局數智未來,思特奇攜手運營商開拓AI賦能新范式
- 工業(yè)和信息化部將推動電動自行車生產企業(yè)優(yōu)化產品
- 我國新能源汽車行業(yè)用戶滿意度提升 自主品牌競爭優(yōu)勢顯著
- 2.8萬億市場崛起 應急裝備產業(yè)創(chuàng)新動能激活


