亚洲丁香婷婷,亚洲精品欧美精品中文字幕,亚洲天堂国产,成年女人18级毛片毛片免费观看,99久久精品免费精品国产,成人亚洲欧美日韩中文字幕,久久国产成人午夜aⅴ影院

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek,有新消息!

2026-02-27 16:59:00

每經(jīng)編輯|張錦河    

據(jù)媒體2月27日?qǐng)?bào)道,在業(yè)界對(duì)新一代旗艦?zāi)P虳eepSeek V4的翹首期盼中,DeepSeek團(tuán)隊(duì)卻悄然放出了一篇新的學(xué)術(shù)論文。

圖片

這篇論文由DeepSeek聯(lián)合北大、清華共同撰寫,將研究方向投向了決定大模型實(shí)際應(yīng)用落地的關(guān)鍵一環(huán)——推理速度,為日益復(fù)雜的AI智能體,提供一套高效的底層系統(tǒng)解決方案。

具體來說,新論文介紹了一個(gè)名為DualPath的創(chuàng)新推理系統(tǒng),專門針對(duì)智能體工作負(fù)載下的大模型(LLM)推理性能進(jìn)行優(yōu)化。通過引入“雙路徑讀取KV-Cache(類似記憶緩存)”機(jī)制,重新分配存儲(chǔ)網(wǎng)絡(luò)負(fù)載,將離線推理吞吐量最高提升 1.87 倍,在線服務(wù)的每秒智能體運(yùn)行數(shù)平均提升 1.96 倍。

論文在引言部分提到,大模型正從單輪對(duì)話機(jī)器人和獨(dú)立推理模型,快速演進(jìn)為智能體系統(tǒng) ——能夠自主規(guī)劃、調(diào)用工具,并通過多輪交互解決實(shí)際任務(wù)。這種應(yīng)用范式的轉(zhuǎn)變,推動(dòng)大模型推理工作負(fù)載發(fā)生重大變革:從傳統(tǒng)的人類-大模型交互,轉(zhuǎn)向人類-大模型-環(huán)境交互,交互輪次可達(dá)數(shù)十甚至數(shù)百輪。

上下文會(huì)跨輪次累積,最終長(zhǎng)度可能達(dá)到極值。此時(shí)模型不需要大量計(jì)算,反而需要頻繁從硬盤讀取歷史上下文的 KV-Cache;現(xiàn)有系統(tǒng)中,只有負(fù)責(zé)預(yù)處理的引擎會(huì)讀取KV-Cache,它的網(wǎng)卡帶寬被占滿,而負(fù)責(zé)生成內(nèi)容的解碼引擎,網(wǎng)卡帶寬基本閑置,導(dǎo)致整個(gè)系統(tǒng)速度被卡脖子

因此,論文提出的DualPath,針對(duì)智能體工作負(fù)載、重新設(shè)計(jì)現(xiàn)代推理架構(gòu)中 KV-Cache加載邏輯,解決大模型做智能體任務(wù)時(shí),速度被 “數(shù)據(jù)讀取”拖慢的核心問題,重要的是把閑置的帶寬資源利用起來,相當(dāng)于給數(shù)據(jù)讀取 “多開了一條高速路”,實(shí)現(xiàn)速度的大幅提升。

這一論文成果延續(xù)了DeepSeek一貫的風(fēng)格,在工程化層面將性能優(yōu)化推向極致。有從業(yè)者認(rèn)為,DeepSeek做這類優(yōu)化屬于缺顯卡的無奈之舉,屬于“臟活兒累活兒”,大家更期待團(tuán)隊(duì)在模型上做創(chuàng)新。

關(guān)于DeepSeek V4的發(fā)布時(shí)間,市場(chǎng)傳聞已幾經(jīng)更迭。從最初傳聞的2月春節(jié)前后,到外媒最新報(bào)道的“最快下周”,再到業(yè)內(nèi)人士預(yù)測(cè)的3月前后,傳聞鏈條愈發(fā)撲朔迷離。

就在近日,外網(wǎng)有網(wǎng)友爆料稱,DeepSeek 正在測(cè)試 V4 Lite 模型,代號(hào)為“Sealion-lite”,上下文窗口為 100萬tokens,并原生支持多模態(tài)推理。也有消息提及,DeepSeek已在近期將重大更新版本V4向華為等國(guó)內(nèi)廠商提供提前訪問權(quán),以支持其優(yōu)化處理器軟件,確保模型在硬件上高效運(yùn)行。然而,英偉達(dá)等廠商尚未獲得類似權(quán)限。

面對(duì)傳聞,DeepSeek依舊保持其一貫的沉默,目前并未進(jìn)行任何回應(yīng)。

此前,DeepSeek被大量用戶吐槽風(fēng)格突變,"變冷淡",從原本細(xì)膩共情變?yōu)?/span>不稱昵稱、文風(fēng)生硬帶“登味”,共情能力下降。

2月12日晚,話題“Deepseek被指變冷淡了”登上微博熱搜。當(dāng)天,多名用戶反饋,DeepSeek在網(wǎng)頁端和APP端進(jìn)行了版本更新,支持最高1M(百萬)Token的上下文長(zhǎng)度。而去年8月發(fā)布的DeepSeekV3.1上下文長(zhǎng)度拓展至128K。

作為較早入局國(guó)內(nèi)大模型賽道的玩家,DeepSeek憑借早期技術(shù)積累和差異化定位,曾在AI助手市場(chǎng)占據(jù)先發(fā)優(yōu)勢(shì)。而隨著字節(jié)跳動(dòng)豆包、百度文心一言、阿里通義千問等巨頭產(chǎn)品加速迭代,以及ChatGPT、Claude等海外強(qiáng)敵持續(xù)施壓,國(guó)內(nèi)AI助手賽道已進(jìn)入白熱化競(jìng)爭(zhēng)階段。

每日經(jīng)濟(jì)新聞綜合第一財(cái)經(jīng)、公開信


如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0