每日經(jīng)濟(jì)新聞 2023-11-16 23:47:54
◎向量數(shù)據(jù)庫(kù)通過(guò)統(tǒng)一企業(yè)數(shù)據(jù)與大模型交互的“語(yǔ)言”,讓AI變得更加通用和高效。這已經(jīng)成為AI浪潮下的行業(yè)共識(shí)。
每經(jīng)記者|王帆 每經(jīng)編輯|張海妮
今年7月,騰訊云正式發(fā)布AI原生向量數(shù)據(jù)庫(kù),最高支持10億級(jí)向量檢索規(guī)模。四個(gè)月后,在11月15日的騰訊云向量數(shù)據(jù)庫(kù)技術(shù)及產(chǎn)業(yè)峰會(huì)上,騰訊云宣布將向量數(shù)據(jù)庫(kù)檢索規(guī)模從十億升級(jí)至千億級(jí)別。
向量數(shù)據(jù)庫(kù)使用向量化計(jì)算,能夠高速地處理大規(guī)模的復(fù)雜數(shù)據(jù),解決傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)中的痛點(diǎn),是大模型訓(xùn)練過(guò)程中數(shù)據(jù)存儲(chǔ)的更優(yōu)選擇。在接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體記者采訪(fǎng)時(shí),騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云表示:“向量在未來(lái)是一種通用的人工智能數(shù)據(jù)格式,能夠屏蔽掉因底層數(shù)據(jù)格式的差異導(dǎo)致無(wú)法很好使用非結(jié)構(gòu)化數(shù)據(jù)的問(wèn)題。”
也就是說(shuō),向量數(shù)據(jù)庫(kù)通過(guò)統(tǒng)一企業(yè)數(shù)據(jù)與大模型交互的“語(yǔ)言”,讓AI變得更加通用和高效。這已經(jīng)成為AI浪潮下的行業(yè)共識(shí)。
圖片來(lái)源:每經(jīng)記者 孔澤思 攝(資料圖)
11月15日,在騰訊云向量數(shù)據(jù)庫(kù)技術(shù)及產(chǎn)業(yè)峰會(huì)上,騰訊云全面升級(jí)向量數(shù)據(jù)庫(kù)多項(xiàng)核心性能,最高支持千億級(jí)向量規(guī)模和500萬(wàn)QPS(每秒查詢(xún)率)峰值能力,同時(shí)和信通院一起聯(lián)合50多家企業(yè)共同發(fā)布了國(guó)內(nèi)首個(gè)向量數(shù)據(jù)庫(kù)標(biāo)準(zhǔn),推進(jìn)向量數(shù)據(jù)庫(kù)及大模型相關(guān)產(chǎn)業(yè)走向大規(guī)模應(yīng)用。
騰訊方面透露,自7月份正式發(fā)布以來(lái),騰訊云向量數(shù)據(jù)庫(kù)經(jīng)過(guò)多次迭代升級(jí),在企業(yè)級(jí)能力上持續(xù)突破:在優(yōu)化版的IVF索引支持下,從最初支持的十億向量規(guī)模到現(xiàn)在的千億規(guī)模;不斷優(yōu)化索引的壓縮算法,讓相同的內(nèi)存可以存儲(chǔ)5-10倍的數(shù)據(jù);集成Embedding(嵌入)功能,讓用戶(hù)無(wú)須關(guān)注向量生成過(guò)程,就可以實(shí)現(xiàn)快速的數(shù)據(jù)處理。
騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云在會(huì)上表示:“從編程語(yǔ)言到自然語(yǔ)言,大模型重塑了算力調(diào)度方式。而AGI(通用人工智能)時(shí)代,也需要智能化的數(shù)據(jù)調(diào)度范式。AGI時(shí)代的數(shù)據(jù)平臺(tái),向量數(shù)據(jù)庫(kù)是數(shù)據(jù)的中樞,騰訊云向量數(shù)據(jù)庫(kù)希望成為這個(gè)數(shù)據(jù)中樞,通過(guò)企業(yè)級(jí)和智能化的能力助力各行各業(yè)一起走向AGI。”
在會(huì)后接受采訪(fǎng)時(shí),羅云進(jìn)一步分析道:“向量在未來(lái)是一種通用的人工智能數(shù)據(jù)格式,它連接關(guān)鍵數(shù)據(jù)庫(kù)、非關(guān)鍵數(shù)據(jù)庫(kù)、對(duì)象存儲(chǔ)、文件存儲(chǔ)各式各樣結(jié)構(gòu)的數(shù)據(jù),把這些數(shù)據(jù)集中化放在一個(gè)數(shù)據(jù)管理平臺(tái)上,屏蔽掉因底層數(shù)據(jù)格式的差異導(dǎo)致無(wú)法很好使用非結(jié)構(gòu)化數(shù)據(jù)的問(wèn)題。”他提到,大模型目前更多是解決計(jì)算問(wèn)題,而向量數(shù)據(jù)庫(kù)解決的是存儲(chǔ)問(wèn)題,兩者之間相互支持配合,是一種“你中有我,我中有你”的關(guān)系。
如今,向量數(shù)據(jù)庫(kù)通過(guò)統(tǒng)一數(shù)據(jù)“語(yǔ)言”能夠加速大模型高效落地,已經(jīng)成為了行業(yè)共識(shí)。今年全球有多家向量數(shù)據(jù)庫(kù)創(chuàng)業(yè)公司獲得新融資。阿里云今年7月也發(fā)布了內(nèi)置向量引擎功能的最新版云原生數(shù)倉(cāng)AnalyticDB,用戶(hù)僅需30分鐘即可構(gòu)建專(zhuān)屬生成式AI應(yīng)用。
據(jù)羅云介紹,目前騰訊云向量數(shù)據(jù)庫(kù)已經(jīng)累計(jì)服務(wù)了騰訊內(nèi)部40多個(gè)業(yè)務(wù),日請(qǐng)求量達(dá)1600億次,服務(wù)了包括博世、銷(xiāo)售易、搜狐、好未來(lái)、鏈家等在內(nèi)的超過(guò)1000家外部客戶(hù)。
例如,在SaaS領(lǐng)域,幫助企業(yè)客戶(hù)快速構(gòu)建私域知識(shí)庫(kù)、智能客服系統(tǒng);在電商行業(yè),使用向量數(shù)據(jù)庫(kù)來(lái)提升推薦、搜索、廣告業(yè)務(wù)的推薦效果;在出行行業(yè),使用向量數(shù)據(jù)庫(kù)來(lái)加速自動(dòng)駕駛模型訓(xùn)練。此外,在教育行業(yè)以及文創(chuàng)等行業(yè)也有廣泛應(yīng)用。
《每日經(jīng)濟(jì)新聞》記者注意到,向量數(shù)據(jù)庫(kù)擁有騰訊云產(chǎn)品一貫的推廣邏輯——在內(nèi)部豐富的產(chǎn)品矩陣中打磨跑通,再對(duì)外輸出經(jīng)驗(yàn)。羅云認(rèn)為,騰訊自己把產(chǎn)品的應(yīng)用吃透,再放到外部去,客戶(hù)的滿(mǎn)意度自然就會(huì)起來(lái)。“在To B這種賽道,一個(gè)客戶(hù)的試錯(cuò)成本是很高的。如果客戶(hù)由于我們的服務(wù)沒(méi)有支撐好他的業(yè)務(wù),那這種業(yè)界的口碑傳播其實(shí)對(duì)我們整個(gè)云品牌的創(chuàng)傷是挺大的。”他說(shuō)道。
那么,為何最早使用騰訊云向量數(shù)據(jù)庫(kù)的是SaaS領(lǐng)域以及電商出行、教育等行業(yè)?羅云認(rèn)為,產(chǎn)品落地的“冷啟動(dòng)”對(duì)象,首先主要來(lái)自騰訊云既有的客戶(hù)群體,其次是取決于客戶(hù)意愿,對(duì)新興業(yè)務(wù)是否主動(dòng)擁抱。
羅云稱(chēng),“我和很多的企業(yè)主都在聊,大家很饑渴也很焦慮,生怕在AI時(shí)代掉隊(duì),但他們其實(shí)也不太明白怎么樣去用好向量數(shù)據(jù)庫(kù),怎么樣用好大模型,怎么樣把自己的知識(shí)變成向量數(shù)據(jù)存儲(chǔ)起來(lái)。盡管向量數(shù)據(jù)庫(kù)是很重計(jì)算、重內(nèi)存的事情,整個(gè)行業(yè)都在探討解決方案,但目前來(lái)看,成本還不是當(dāng)前推廣向量數(shù)據(jù)庫(kù)的主要‘卡點(diǎn)’,客戶(hù)更多的還是考慮怎樣把自己的行業(yè)know-how(技術(shù)訣竅)和AI技術(shù)打通”。
封面圖片來(lái)源:每經(jīng)記者 孔澤思 攝(資料圖)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP