悶聲干大事!DeepSeek悄然發(fā)布V3新版本。
沒有發(fā)布會,沒有媒體宣傳,3月24日晚間,DeepSeek就這樣“悄悄地”將其最新版V3-0324模型
根據(jù)社區(qū)測試和分析,此次更新雖然不是全新一代模型,僅屬于“小版本升級”,但其編程能力已達到與Claude 3.7 Sonnet相當(dāng)?shù)乃剑谀承y試場景中甚至表現(xiàn)更佳。
有網(wǎng)友表示,新版V3較上一代來說,相當(dāng)于Sonnet 3.6之于Sonnet 3.5的飛躍。
還有網(wǎng)友指出,新版V3模型的編碼能力完全超預(yù)期,堪稱目前最強大的免費AI模型。
展開全文
負載均衡策略:更高效的Moe架構(gòu)
為解決傳統(tǒng)MoE模型中的負載不均衡問題,DeepSeek團隊引入了創(chuàng)新性的“偏差項”機制,旨在幫助V3在訓(xùn)練過程中有效平衡專家負載,提升模型性能。
此外,V3還采用了節(jié)點受限的路由機制,以減少跨節(jié)點通信開銷,提高訓(xùn)練效率,這對于大規(guī)模分布式訓(xùn)練至關(guān)重要。
這些技術(shù)創(chuàng)新使得新版V3在推理速度上實現(xiàn)了顯著提升,使V3能在保持高效計算的同時,擴展到更多節(jié)點和專家。
編程能力再進化:一個提示詞生成完整前端頁面
根據(jù)國外開源評測平臺kcores-llm-arena的最新測試數(shù)據(jù),V3-0324的代碼能力達到了328.3分,超過了普通版的Claude 3.7 Sonnet(322.3分),接近思維鏈版本的334.8分。
這一成績意味著,新版V3已成為目前編程能力最強的開源模型之一。
實際測試中,用戶用一個簡單的提示詞就讓V3-0324生成了整個登錄頁面。
還有用戶直觀地指出,只是點了兩次“continue”,看看生成的代碼量有多恐怖!
再加上不限時、完全免費的“殺手锏”,可以說在前端開發(fā)層面,新版V3已經(jīng)打敗了OpenAI的o1-pro和GPT-4.5。
新版V3的審美也很在線,用戶用,新版V3的設(shè)計明顯比上一版要好看得多。
根據(jù)prompt:“寫一個精美的落地頁,內(nèi)容是deepseek v3發(fā)布”,這是上一版V3生成的網(wǎng)頁:
新版V3的落地頁則是這樣:
開源協(xié)議升級:商業(yè)應(yīng)用門檻大幅降低
不僅技術(shù)能力提升,DeepSeek還將V3-0324的開源許可與R1一樣更新為MIT開源許可,這意味著新版V3有著比初代V3更寬松的開源使用條件。
公開資料顯示,MIT許可以商業(yè)友好著稱,使用該許可的項目可以與商業(yè)和專有軟件自由集成。
這一變化對希望在商業(yè)項目中應(yīng)用高性能AI模型的開發(fā)者和公司來說,可能是本次更新最具戰(zhàn)略意義的改變。它進一步降低了AI技術(shù)的使用門檻,加速了技術(shù)普惠進程。
開源浪潮涌動,商業(yè)模型“瑟瑟發(fā)抖”
DeepSeek V3-0324的出現(xiàn)表明,開源AI模型正在以驚人的速度追趕甚至在某些方面超越頂級閉源商業(yè)模型。這種趨勢正在給OpenAI、Anthropic等商業(yè)AI公司帶來前所未有的壓力。
正如海外用戶所評論的:“很高興看到這些開源模型繼續(xù)給大公司施壓,促使它們以更低的成本構(gòu)建更好的模型?!?/p>
隨著DeepSeek這樣的開源模型不斷提升性能并放寬使用條件,AI技術(shù)的民主化和普惠化進程正在加速,一個更加開放、創(chuàng)新的AI生態(tài)系統(tǒng)正在形成。
網(wǎng)友不禁感嘆:DeepSeek簡直讓科技普惠成為現(xiàn)實!
還有網(wǎng)友大膽猜測:新版V3來了,R2還會遠嗎?
評論