12月1日晚,DeepSeek又上新了兩款新模型 ,DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上全球領先。
兩款模型有著不同的定位 。DeepSeek-V3.2的目標是平衡推理能力與輸出長度,適合日常使用 ,例如問答場景和通用智能體任務場景。9月底DeepSeek發布了實驗版V3.2-Exp,此次是正式版更新。在公開推理測試中,V3.2達到了GPT-5的水平,僅略低于谷歌的Gemini3 Pro 。
DeepSeek-V3.2-Speciale則是此次的重頭戲 ,其目標是“將開源模型的推理能力推向極致,探索模型能力的邊界”。據介紹,Speciale是V3.2的長思考增強版 ,同時結合了DeepSeek-Math-V2的定理證明能力,該模型具備出色的指令跟隨 、嚴謹的數學證明與邏輯驗證能力。
據DeepSeek公布的數據,Speciale在多個推理基準測試中超越谷歌最先進的Gemini3 Pro。具體來看 ,在美國數學邀請賽、哈佛MIT數學競賽、國際奧林匹克數學競賽等測試中,V3.2-Speciale都超過了Gemini3 Pro,但在編程 、理工科博士生測試中略遜于谷歌 。
同時 ,Speciale模型斬獲了IMO(國際數學奧林匹克)、ICPC World Finals(國際大學生程序設計競賽全球總決賽)及IOI(國際信息學奧林匹克)金牌。其中,ICPC 與 IOI 成績分別達到了人類選手第二名與第十名的水平。
盡管取得了這些成就,但在技術報告中 ,DeepSeek承認,與Gemini3 Pro等前沿閉源模型相比,自家模型仍存在一定的局限性 。首先,V3.2的世界知識廣度仍落后于領先的專有模型 ,其次在令牌(Token)效率方面,V3.2通常需要更多的令牌才能達到像Gemini3 Pro這樣的模型輸出質量。在解決復雜任務方面也不如前沿模型。
DeepSeek稱,團隊計劃在未來通過增加預訓練計算量來填補知識空白 ,并專注于優化模型推理鏈的智能密度以提高效率,進一步改進基礎模型和訓練后方案 。
值得一提的是,在技術報告中 ,DeepSeek還談到當前開源與閉源模型的差距在拉大。
DeepSeek表示,推理模型的發布是大模型發展的關鍵轉折點,推動了整體性能的大幅躍升。自這一里程碑事件以來 ,大模型能力在快速發展 。然而,過去幾個月中出現了明顯的分化:盡管開源圈持續取得進步,但閉源專有模型如海外谷歌、OpenAI、Anthropic的性能增長速度卻顯著更快。
“閉源模型與開源模型之間的性能差距并未縮小 ,反而日益擴大,專有系統在復雜任務中展現出越來越強的優勢。 ”DeepSeek認為,其中有三個關鍵的缺陷 。
一方面,在架構層面 ,對標準注意力機制的過度依賴嚴重制約了長序列處理的效率;其次,在資源分配方面,開源模型在后訓練階段的計算投入不足 ,限制了模型在高難度任務上的表現;最后,在AI智能體領域,開源模型在泛化能力和指令遵循能力上與專業模型相比存在明顯差距 ,影響實際部署效果。
為了突破這些限制,DeepSeek在9月底發布實驗版V3.2-Exp時,提出了稀疏注意力機制(DSA) ,希望大幅降低計算復雜度。在經過兩個月的實驗后,DeepSeek確認了稀疏注意力機制的有效性,并表示 ,在不犧牲長上下文性能的前提下,團隊解決了關鍵的計算復雜性問題。
此次發布的兩款模型均引入了這一機制 。據DeepSeek,除了在多個推理基準測試中,V3.2的性能大幅提升外 ,在智能體場景中,V3.2也成為一種具有成本效益的替代方案,不僅縮小了開源模型與前沿專有模型之間的性能差距 ,成本也顯著降低。
目前,DeepSeek的官方網頁端 、App 和 API 均已更新為正式版 DeepSeek-V3.2,但增強的Speciale版本目前僅以臨時API服務形式開放 ,供社區評測與研究。
在海外社媒上,有網友認為,DeepSeek 此次發布是了不起的成就 ,“匹配 GPT-5和Gemini3 Pro的開源模型出現了,差距正式消除 。”DeepSeek不斷證明,嚴謹的工程設計可以超越單純的參數規模。但如同DeepSeek所述的那樣 ,我們仍需正視開源與閉源在整體性能上的差距,不斷突破開源的邊界。
雙悅網配資-配資平臺_炒股配資平臺_配資炒股公司提示:文章來自網絡,不代表本站觀點。
雙悅網配資-配資平臺_炒股配資平臺_配資炒股公司?股票配資平臺提供多樣化的配資產品,滿足不同客戶的投資需求,助力客戶實現多元化投資。
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價拉漲,尾盤封漲停板...
當地時間3月24日,特斯拉美股漲幅擴大至5%,現報262.055美元/股。...
國海富蘭克林基金國富深化價值基金經理劉曉日前發表了對?2025?年市場的展望。劉曉指出,國內經濟正處于復蘇通道,市場大幅...
記者辛圓3月25日,博鰲亞洲論壇旗艦報告《亞洲經濟前景及一體化進程2025年度報告》(以下簡稱《報告》...
記者王珍中國國際經濟交流中心副理事長、國務院發展研究中心原副主任王一鳴周一在“中國發展高層論壇2025...
【隔夜行情】?周五(2025年3月21日),A股三大指數集體下跌,截至收盤,截止收盤,滬指跌1.29%,報收33...
3月24日,AI眼鏡概念股開盤拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國光電器等跟漲。...
近日,開源證券大連分公司遭大連證監局處罰,暫停其辦理需要合格投資者認定相關業務六個月。該懲處力度在近年來券商分支機構中并...
記者|趙陽戈年初,證監會就修改《證券發行與承銷管理辦法》部分條款向社會公開征求意見,市場也將注意力投向了...
記者辛圓給補貼、建平臺,為了吸引更多高層次人才,各地紛紛放出“大招”。據央廣網周一發布消息,湖...
3月24日,易方達國證自由現金流ETF公開發售。該產品跟蹤國證自由現金流指數,這個指數是什么?有哪些優勢?投資價值如何?...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
國務院新聞辦公室9日發布《關于中美經貿關系若干問題的中方立場》白皮書,澄清中美經貿關系事實,闡明中方對相關問題的政策立場...
滬深兩市成交額連續第44個交易日突破1萬億,較昨日此時縮量超900億。...
3月24日,業內權威專家表示,MLF(中期借貸便利)不再有統一的中標利率,標志著MLF利率的政策屬性完全退出。3月24日...