“沒(méi)有一百萬(wàn)張顯卡,你根本做不了大模型。”這是過(guò)去兩年籠罩在AI行業(yè)頭頂?shù)摹百Y金算力決定論 ”。但在月之暗面(Kimi)總裁張予彤看來(lái) ,當(dāng)算力資源不再是唯一的敘事邏輯時(shí),事情正在發(fā)生變化 。
近日,張予彤現(xiàn)身清華大學(xué)進(jìn)行了公開(kāi)分享。這是其自2024年底卷入與金沙江創(chuàng)投主管合伙人朱嘯虎的“股權(quán)隱瞞”風(fēng)波后 ,張予彤罕見(jiàn)的一次公開(kāi)露面。
去年底,金沙江創(chuàng)投主管合伙人朱嘯虎曾公開(kāi)指責(zé)張予彤在職期間隱瞞在月之暗面的900萬(wàn)股免費(fèi)股份,違反受托之責(zé);而月之暗面創(chuàng)始人楊植麟則隨后發(fā)文力挺 ,明確其作為聯(lián)合創(chuàng)始人的身份,強(qiáng)調(diào)股份授予是基于其在公司運(yùn)營(yíng)、戰(zhàn)略及融資方面的長(zhǎng)期貢獻(xiàn),且“與部分股東沒(méi)有投資月之暗面的決策獨(dú)立” 。
風(fēng)波并未影響這位Kimi“二號(hào)人物 ”的步調(diào)。作為負(fù)責(zé)公司整體戰(zhàn)略與商業(yè)化的總裁 ,張予彤在此次分享中,不僅披露了最新上線模型 Kimi K2 Thinking 的技術(shù)細(xì)節(jié),也集中闡述了這家公司接下來(lái)的業(yè)務(wù)走向和商業(yè)化思考。
▍打破“唯算力論”
“從 Kimi 創(chuàng)業(yè)之初 ,行業(yè)里最大的質(zhì)疑就是:你們沒(méi)有百萬(wàn)張卡,怎么跟大廠拼?”張予彤坦言,這種質(zhì)疑源于一種線性的行業(yè)共識(shí):更強(qiáng)的模型必然對(duì)應(yīng)天價(jià)的資本開(kāi)支,“但當(dāng)我們慢慢意識(shí)到算力資源不是唯一敘事時(shí) ,事情就變得有意思了 ” 。
張予彤透露,月之暗面在訓(xùn)練萬(wàn)億參數(shù)的Kimi K2模型時(shí),首次驗(yàn)證了二階優(yōu)化器Muon的大規(guī)??尚行? ,實(shí)現(xiàn)了至少兩倍的token效率提升,“這不僅意味著訓(xùn)練成本下降兩倍,而是同一份數(shù)據(jù)我們能得到更多的智能。”
張予彤強(qiáng)調(diào) ,“現(xiàn)在訓(xùn)練的真正瓶頸是數(shù)據(jù)墻,而不是算力本身”。Muon優(yōu)化器此前已被發(fā)明,但從未有人將其應(yīng)用于萬(wàn)億參數(shù)模型訓(xùn)練 。月之暗面團(tuán)隊(duì)攻克了規(guī)?;褂脮r(shí)面臨的訓(xùn)練穩(wěn)定性難題 ,讓這一技術(shù)真正落地。
除了算法創(chuàng)新,月之暗面還推行“Day-0 Co-Design ”理念——在模型開(kāi)始訓(xùn)練前,就進(jìn)行基礎(chǔ)設(shè)施與算法的深度耦合設(shè)計(jì)。張予彤表示 ,基礎(chǔ)設(shè)施和算法人才的緊密協(xié)同,讓每一項(xiàng)改進(jìn)都以“復(fù)利”方式體現(xiàn)在智能效率上 。
這種技術(shù)路線得到了市場(chǎng)驗(yàn)證。今年11月上線的Kimi K2 Thinking模型,在“人類最后的考試”(Humanity's Last Exam)等多項(xiàng)基準(zhǔn)測(cè)試中,表現(xiàn)對(duì)標(biāo)GPT-5和Claude Sonnet 4.5等全球頂尖模型。在斯坦福大學(xué)HELM綜合評(píng)測(cè)中 ,K2模型獲得非思考模型最佳成績(jī)。第三方盲測(cè)平臺(tái)LMArena顯示,Kimi K2 Thinking是開(kāi)源模型中表現(xiàn)最好的 。
“我們不是說(shuō)今天就做到了世界最好,但已經(jīng)能夠做到在單位算力上產(chǎn)出最高的智能價(jià)值 ” ,張予彤坦言,這是公司接下來(lái)最重要的戰(zhàn)略目標(biāo)。
目前,Cursor、Youware 、Genspark以及Perplexity等全球知名AI應(yīng)用已接入Kimi K2模型。Perplexity作為擁有數(shù)千萬(wàn)活躍用戶、月訪問(wèn)量2.8億次的AI搜索應(yīng)用 ,在其模型列表中,除四個(gè)閉源模型外,唯一接入的就是Kimi K2 Thinking 。
張予彤特別提到 ,AI搜索中的深度研究是Kimi模型的優(yōu)勢(shì)場(chǎng)景。K2 Thinking支持多達(dá)200-300輪工具調(diào)用,可以邊思考邊使用工具完成復(fù)雜調(diào)研任務(wù)。Vercel創(chuàng)始人在社交媒體透露,其內(nèi)部Agent場(chǎng)景測(cè)試中 ,Kimi實(shí)際表現(xiàn)優(yōu)于其他閉源模型 。投資機(jī)構(gòu)Social Capital的CEO也表示,旗下投資公司已將大量工作轉(zhuǎn)至K2平臺(tái),因?yàn)椤靶阅軓?qiáng),成本又比頂尖閉源模型低得多”。
從產(chǎn)品層面 ,月之暗面今年踐行“模型即產(chǎn)品”理念,將模型與Agent產(chǎn)品體驗(yàn)垂直整合。張予彤介紹,團(tuán)隊(duì)從預(yù)訓(xùn)練階段就加入大量真實(shí)Agent場(chǎng)景數(shù)據(jù) ,包括工具使用和多輪規(guī)劃的軌跡數(shù)據(jù);產(chǎn)品上線后,用真實(shí)用戶體驗(yàn)作為信號(hào)持續(xù)優(yōu)化模型 。
今年推出的“OK Computer”Agent模式,產(chǎn)品名靈感源自Radiohead經(jīng)典專輯。該模式目前支持包括圖片生成、音頻生成在內(nèi)的20多種工具 ,工具調(diào)用最高可達(dá)50步,近期將升級(jí)至200-300步?!拔覀兊哪繕?biāo)是讓OK Computer成為每個(gè)人的全棧助理, ”張予彤說(shuō) 。
她透露 ,用戶對(duì)OK Computer進(jìn)行了極限測(cè)試:有人上傳龐大Excel文件處理上百萬(wàn)行數(shù)據(jù),有人上傳大量文件要求Agent完整理解上下文。這種“長(zhǎng)時(shí)任務(wù)”能力正是月之暗面下一步重點(diǎn)方向——讓Agent能夠像在公司工作一樣,開(kāi)完周會(huì)后連續(xù)工作一整周。
▍不競(jìng)爭(zhēng)的競(jìng)爭(zhēng)策略
在底層效率問(wèn)題被創(chuàng)新攻克后 ,如何將技術(shù)突破轉(zhuǎn)化為商業(yè)壁壘和市場(chǎng)份額,成為新的考量。大模型市場(chǎng)依舊火熱,這家獨(dú)角獸公司如何在巨頭環(huán)伺下贏得市場(chǎng)地位,也是現(xiàn)場(chǎng)關(guān)注的焦點(diǎn) 。
“我覺(jué)得最有效的競(jìng)爭(zhēng)方式就是不競(jìng)爭(zhēng) ,”當(dāng)被問(wèn)及同大廠巨頭競(jìng)爭(zhēng)時(shí),張予彤給出了這樣的回答,她解釋 ,不競(jìng)爭(zhēng)不是躺平,而是找到自己的敘事和真正擅長(zhǎng)的事情。
對(duì)月之暗面而言,第一個(gè)核心優(yōu)勢(shì)是底層技術(shù)創(chuàng)新?!按竽P皖I(lǐng)域還有很多真正需要解決的問(wèn)題 ,這些問(wèn)題本質(zhì)上都需要底層技術(shù)創(chuàng)新,這正是創(chuàng)業(yè)公司最有優(yōu)勢(shì)的地方 。 ”
第二個(gè)優(yōu)勢(shì)是端到端的聯(lián)合優(yōu)化能力。張予彤直言,大企業(yè)內(nèi)部不可避免存在組織壁壘 、信息傳遞不暢等問(wèn)題 ,而月之暗面只有300人,算法、工程、產(chǎn)品可以全部坐在一起,“很多新想法可以當(dāng)天提出 、當(dāng)天實(shí)驗(yàn)”。
從產(chǎn)品定位看 ,Kimi有意識(shí)地做出取舍 。張予彤稱,生活?yuàn)蕵?lè)方向沒(méi)做,多模態(tài)生成也沒(méi)做,“我們更專注于邏輯層、Agent層 ,以及深入研究、PPT 、數(shù)據(jù)分析、網(wǎng)站開(kāi)發(fā)這類偏生產(chǎn)力、偏復(fù)雜任務(wù)的鏈路,”她表示,這些任務(wù)需要長(zhǎng)程規(guī)劃和復(fù)雜工具調(diào)用 ,能創(chuàng)造更高經(jīng)濟(jì)價(jià)值。
談及模型公司與AI應(yīng)用的關(guān)系,張予彤認(rèn)為這是一個(gè)動(dòng)態(tài)演進(jìn)過(guò)程。她表示,與互聯(lián)網(wǎng)產(chǎn)品不同 ,大模型能力仍在快速變化,應(yīng)用側(cè)需要具備“前瞻性設(shè)計(jì) ”能力,去想象尚未出現(xiàn)但一定會(huì)沿技術(shù)演進(jìn)路徑出現(xiàn)的能力 。“如果沒(méi)有這種前瞻性 ,可能會(huì)出現(xiàn)產(chǎn)品革新了體驗(yàn)但模型能力跟不上,或者模型能力躍升但產(chǎn)品設(shè)計(jì)還停留在分步調(diào)用的舊范式。”
(文章來(lái)源:財(cái)聯(lián)社)
雙悅網(wǎng)配資-配資平臺(tái)_炒股配資平臺(tái)_配資炒股公司提示:文章來(lái)自網(wǎng)絡(luò),不代表本站觀點(diǎn)。
雙悅網(wǎng)配資-配資平臺(tái)_炒股配資平臺(tái)_配資炒股公司?股票配資平臺(tái)提供多樣化的配資產(chǎn)品,滿足不同客戶的投資需求,助力客戶實(shí)現(xiàn)多元化投資。
3月24日,海洋王照明科技股份有限公司(以下簡(jiǎn)稱“海洋王”,002724.SZ)早盤(pán)一字跌停,此后股價(jià)拉漲,尾盤(pán)封漲停板...
當(dāng)?shù)貢r(shí)間3月24日,特斯拉美股漲幅擴(kuò)大至5%,現(xiàn)報(bào)262.055美元/股。...
國(guó)海富蘭克林基金國(guó)富深化價(jià)值基金經(jīng)理劉曉日前發(fā)表了對(duì)?2025?年市場(chǎng)的展望。劉曉指出,國(guó)內(nèi)經(jīng)濟(jì)正處于復(fù)蘇通道,市場(chǎng)大幅...
記者辛圓3月25日,博鰲亞洲論壇旗艦報(bào)告《亞洲經(jīng)濟(jì)前景及一體化進(jìn)程2025年度報(bào)告》(以下簡(jiǎn)稱《報(bào)告》...
記者王珍中國(guó)國(guó)際經(jīng)濟(jì)交流中心副理事長(zhǎng)、國(guó)務(wù)院發(fā)展研究中心原副主任王一鳴周一在“中國(guó)發(fā)展高層論壇2025...
【隔夜行情】?周五(2025年3月21日),A股三大指數(shù)集體下跌,截至收盤(pán),截止收盤(pán),滬指跌1.29%,報(bào)收33...
3月24日,AI眼鏡概念股開(kāi)盤(pán)拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國(guó)光電器等跟漲。...
近日,開(kāi)源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認(rèn)定相關(guān)業(yè)務(wù)六個(gè)月。該懲處力度在近年來(lái)券商分支機(jī)構(gòu)中并...
記者|趙陽(yáng)戈年初,證監(jiān)會(huì)就修改《證券發(fā)行與承銷(xiāo)管理辦法》部分條款向社會(huì)公開(kāi)征求意見(jiàn),市場(chǎng)也將注意力投向了...
記者辛圓給補(bǔ)貼、建平臺(tái),為了吸引更多高層次人才,各地紛紛放出“大招”。據(jù)央廣網(wǎng)周一發(fā)布消息,湖...
3月24日,易方達(dá)國(guó)證自由現(xiàn)金流ETF公開(kāi)發(fā)售。該產(chǎn)品跟蹤國(guó)證自由現(xiàn)金流指數(shù),這個(gè)指數(shù)是什么?有哪些優(yōu)勢(shì)?投資價(jià)值如何?...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡(jiǎn)稱“寧波倍松”)擬通過(guò)大宗交易...
國(guó)務(wù)院新聞辦公室9日發(fā)布《關(guān)于中美經(jīng)貿(mào)關(guān)系若干問(wèn)題的中方立場(chǎng)》白皮書(shū),澄清中美經(jīng)貿(mào)關(guān)系事實(shí),闡明中方對(duì)相關(guān)問(wèn)題的政策立場(chǎng)...
滬深兩市成交額連續(xù)第44個(gè)交易日突破1萬(wàn)億,較昨日此時(shí)縮量超900億。...
3月24日,業(yè)內(nèi)權(quán)威專家表示,MLF(中期借貸便利)不再有統(tǒng)一的中標(biāo)利率,標(biāo)志著MLF利率的政策屬性完全退出。3月24日...