在國慶節前夕,DeepSeek和智譜先后宣布推出新一代大模型。與此同時 ,國產芯片廠商都在第一時間宣布適配,這標志著國產GPU已具備與前沿大模型協同迭代的能力,加速構建自主可控的AI技術生態 。
9月29日 ,DeepSeek宣布開源DeepSeek-V3.2-Exp實驗版模型,該模型首次引入了Attention稀疏注意力架構,并在幾乎不影響模型輸出效果的前提下 ,大幅度提升了長文本訓練和推理效率,被DeepSeek定義為“邁向新一代架構的中間步驟”。
華為、寒武紀 、海光已經完成適配DeepSeek-V3.2-Exp實驗版模型
在DeepSeek宣布后,算力芯片廠商華為、寒武紀(688256)、海光信息(688041)等AI芯片廠商已經宣布適配DeepSeek-V3.2-Exp。
“華為計算”公眾號發文宣布 ,昇騰已快速基于vLLM/SGLang等推理框架完成適配部署,實現DeepSeek-V3.2-Exp Day 0(第零天)支持,并面向開發者開源所有推理代碼和算子實現 。DeepSeek-V3.2-Exp在昇騰設備上128K長序列輸出 ,能夠保持TTFT(首token輸出耗時)低于2秒 、TPOT(每token輸出耗時)低于30毫秒的推理生成速度。
在DeepSeek-V3.2-Exp模型宣布開源幾分鐘內,寒武紀也發文稱其已同步實現對該模型的Day 0適配,并開源大模型推理引擎vLLM-MLU源代碼。
寒武紀稱,公司一直高度重視大模型軟件生態建設 ,支持以DeepSeek為代表的所有主流開源大模型 。借助于長期活躍的生態建設和技術積累,寒武紀得以快速實現對DeepSeek-V3.2-Exp這一全新實驗性模型架構的day 0適配和優化。
寒武紀強調,一直重視芯片和算法的聯合創新 ,致力于以軟硬件協同的方式,優化大模型部署性能,降低部署成本。此前 ,寒武紀對DeepSeek系列模型進行了深入的軟硬件協同性能優化,達成了業界領先的算力利用率水平 。
針對本次的DeepSeek-V3.2-Exp新模型架構,寒武紀通過Triton算子開發實現了快速適配 ,利用BangC融合算子開發實現了極致性能優化,并基于計算與通信的并行策略,再次達成了業界領先的計算效率水平。依托DeepSeek-V3.2-Exp帶來的全新DeepSeek Sparse Attention機制 ,疊加寒武紀的極致計算效率,可大幅降低長序列場景下的訓推成本,共同為客戶提供極具競爭力的軟硬件解決方案。
海光信息也宣布其DCU實現無縫適配+深度調優,做到大模型算力“零等待 ”部署 。
海光信息表示 ,在“深算智能”戰略引領下,海光信息始終致力于AI軟件棧生態建設,全面支持以DeepSeek為主流的全球主流開源大模型。得益于長期、活躍的技術積累 ,海光DCU得以快速對DeepSeek-V3.2-Exp完成“Day0”級高效適配與優化。
基于GPGPU架構強大的生態優勢,與編程開發軟件棧DIK的特性,DeepSeek-V3.2-Exp在海光DCU上展現出優異的性能 ,充分驗證海光DCU高通用性、高生態兼容度及自主可控的技術優勢,已成為支撐AI大模型訓練與推理的關鍵基礎設施。
DeepSeek表示,得益于新模型服務成本的大幅降低 ,官方API價格也相應下調,開發者調用DeepSeek API的成本將降低50%以上 。從價格來看,輸入緩存命中從0.5元降至0.2元/百萬tokens ,緩存未命中從4元降至2元/百萬tokens,輸出由12元降至3元/百萬tokens。
寒武紀和摩爾線程宣布適配智譜新一代大模型 GLM-4.6
9月30日,智譜正式發布并開源新一代大模型 GLM-4.6,在 Agentic Coding等核心能力上實現大幅躍升。這是繼 DeepSeek-V3.2-Exp 與 Claude Sonnet 4.5 之后 ,國慶節前業界的又一重大技術發布 。
智譜表示,在公開基準測試和真實編程任務中,GLM-4.6的代碼生成能力已全面對齊Claude Sonnet 4 ,成為目前國內最強的Coding模型。同時,模型在長上下文處理 、推理能力、信息檢索、文本生成及智能體應用等方面均實現全面升級,整體性能超越DeepSeek-V3.2-Exp。作為開源模型 ,GLM-4.6目前是全球開源生態中性能最強的通用大模型之一,進一步提升了國產大模型在全球競爭格局中的地位 。
智譜官方宣布,GLM-4.6 已在寒武紀領先的國產 AI 芯片上實現 FP8+Int4 混合量化推理部署 ,這也是首次在國產芯片上投產的 FP8+Int4 模型-芯片一體化解決方案。在保持模型精度不變的前提下,該方案大幅降低了推理成本,為國產芯片本地化運行大模型提供了可行路徑和示范意義。
與此同時 ,摩爾線程基于 vLLM 推理框架完成了對GLM-4.6 的適配,新一代GPU可在原生 FP8 精度下穩定運行模型,充分驗證了MUSA 架構及全功能GPU在生態兼容性和快速適配能力方面的優勢 。
華為 、寒武紀、摩爾線程等芯片廠商完成對新一代前沿大模型的適配,這標志著國產GPU已具備與前沿大模型協同迭代的能力 ,加速構建自主可控的AI技術生態。
智譜表示,未來,國產原創的GLM系列大模型與國產芯片的深度協同 ,將在模型訓練和推理環節持續推動性能與效率的雙重優化,構建更加開放、可控 、高效的人工智能基礎設施。
截至30日收盤,寒武紀報收1325元 ,微漲0.11%;海光信息報收252.6元,跌1.27% 。
雙悅網配資-配資平臺_炒股配資平臺_配資炒股公司提示:文章來自網絡,不代表本站觀點。
雙悅網配資-配資平臺_炒股配資平臺_配資炒股公司?股票配資平臺提供多樣化的配資產品,滿足不同客戶的投資需求,助力客戶實現多元化投資。
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價拉漲,尾盤封漲停板...
當地時間3月24日,特斯拉美股漲幅擴大至5%,現報262.055美元/股。...
國海富蘭克林基金國富深化價值基金經理劉曉日前發表了對?2025?年市場的展望。劉曉指出,國內經濟正處于復蘇通道,市場大幅...
記者辛圓3月25日,博鰲亞洲論壇旗艦報告《亞洲經濟前景及一體化進程2025年度報告》(以下簡稱《報告》...
記者王珍中國國際經濟交流中心副理事長、國務院發展研究中心原副主任王一鳴周一在“中國發展高層論壇2025...
【隔夜行情】?周五(2025年3月21日),A股三大指數集體下跌,截至收盤,截止收盤,滬指跌1.29%,報收33...
3月24日,AI眼鏡概念股開盤拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國光電器等跟漲。...
近日,開源證券大連分公司遭大連證監局處罰,暫停其辦理需要合格投資者認定相關業務六個月。該懲處力度在近年來券商分支機構中并...
記者|趙陽戈年初,證監會就修改《證券發行與承銷管理辦法》部分條款向社會公開征求意見,市場也將注意力投向了...
記者辛圓給補貼、建平臺,為了吸引更多高層次人才,各地紛紛放出“大招”。據央廣網周一發布消息,湖...
3月24日,易方達國證自由現金流ETF公開發售。該產品跟蹤國證自由現金流指數,這個指數是什么?有哪些優勢?投資價值如何?...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
國務院新聞辦公室9日發布《關于中美經貿關系若干問題的中方立場》白皮書,澄清中美經貿關系事實,闡明中方對相關問題的政策立場...
滬深兩市成交額連續第44個交易日突破1萬億,較昨日此時縮量超900億。...
3月24日,業內權威專家表示,MLF(中期借貸便利)不再有統一的中標利率,標志著MLF利率的政策屬性完全退出。3月24日...