①向量數(shù)據(jù)庫被視作開發(fā)和應(yīng)用AI大模型過程中的必備的軟件基礎(chǔ)設(shè)施; ②未來隨著生成式AI大模型開發(fā)量和使用量的增長,向量數(shù)據(jù)庫的應(yīng)用有望快速增長;③目前在商業(yè)化方面,向量數(shù)據(jù)庫行業(yè)還處于市場培育期。
《科創(chuàng)板日報》3月22日訊(編輯 宋子喬) 向量數(shù)據(jù)庫開拓者與GUP王者聯(lián)手會擦出什么樣的火花?
在GTC2024大會上,英偉達宣布全球首個GPU加速向量數(shù)據(jù)庫誕生——中國公司Zilliz與英偉達攜手發(fā)布了Milvus2.4版本。
向量數(shù)據(jù)庫是一種專門用于處理向量數(shù)據(jù)的數(shù)據(jù)庫系統(tǒng),這類數(shù)據(jù)通常用于機器學(xué)習(xí)和人工智能應(yīng)用中,如推薦系統(tǒng)、圖像識別和自然語言處理等。GPU(圖形處理單元)因其并行處理能力而成為加速復(fù)雜計算任務(wù)的理想選擇,尤其是在處理大量數(shù)據(jù)時。
英偉達在GPU領(lǐng)域的地位不用多說,Zilliz的全稱是上海徐毓智能科技有限公司,是誕生于中國本土的初創(chuàng)公司,成立于2016年,總部位于上海。在向量數(shù)據(jù)庫系統(tǒng)領(lǐng)域,Zilliz是開拓者,研發(fā)了面向AI生產(chǎn)系統(tǒng)的向量數(shù)據(jù)庫系統(tǒng)。其技術(shù)和產(chǎn)品已經(jīng)被全球超過1000家企業(yè)采用。
Milvus是Zilliz的主要產(chǎn)品,它提供了一個易于使用的界面,允許開發(fā)者和數(shù)據(jù)科學(xué)家快速部署和擴展向量搜索服務(wù)。該產(chǎn)品以其高性能和可擴展性而聞名,能夠處理海量的向量數(shù)據(jù),并提供毫秒級的查詢響應(yīng)時間,還支持多種編程語言的API,包括Python、Java、Go和C++。
Milvus2.4版本向量數(shù)據(jù)庫的創(chuàng)新點在于,利用GPU的高速計算特性,能夠快速執(zhí)行向量相似性搜索和分析,支持更高的并發(fā)用戶請求,同時降低延遲,提供更快的響應(yīng)時間,使其成為支持實時決策和復(fù)雜數(shù)據(jù)分析的理想工具。
據(jù)介紹,它在業(yè)界首次采用了英偉達GPU的高效并行處理能力和RAPIDS cuVS庫中新推出的CAGRA(CUDA-Accelerated Graph Index for Vector Retrieval)技術(shù),提供基于GPU的向量索引和搜索加速能力?;鶞蕼y試顯示,與目前市面上最先進的基于CPU處理器的索引技術(shù)相比,新版GPU加速Milvus能提供高達50倍的向量搜索性能提升。
▌向量數(shù)據(jù)庫——開發(fā)AI大模型的必備軟件
向量數(shù)據(jù)庫是專門用于存儲和管理向量數(shù)據(jù),其具備的快速檢索、混合存儲、向量嵌入等能力很好的解決了AI大模型技術(shù)中普遍存在的知識時效性低、輸入能力有限、回答問題準確度低等問題,因此被視作開發(fā)和應(yīng)用AI大模型過程中的必備的軟件基礎(chǔ)設(shè)施。
從實際應(yīng)用案例來看,向量數(shù)據(jù)庫在AI大模型的訓(xùn)練和推理過程中降本增效的效果已有所顯現(xiàn)。ChatGPT Plugins外接向量數(shù)據(jù)庫,不僅大大拓展了AI大模型交互信息的范圍,還保護了用戶隱私。Qdrant向量數(shù)據(jù)庫與Pienso合作,已經(jīng)實現(xiàn)在開源AI大模型的基礎(chǔ)上開發(fā)私域大模型。
廣發(fā)證券認為,在過去AI模型訓(xùn)練的數(shù)據(jù)量較小、數(shù)據(jù)類型單一的情況下,向量數(shù)據(jù)庫可應(yīng)用的場景較小。自2017年Transformer模型推出后,各科技廠商開始大語言模型的探索,對于向量數(shù)據(jù)庫的需求才開始形成規(guī)模。隨著微軟365Copilot以及ChatGPT企業(yè)版等標桿產(chǎn)品的落地,AI應(yīng)用的發(fā)展正逐步由點擴散到面,未來隨著生成式AI大模型開發(fā)量和使用量的增長,向量數(shù)據(jù)庫的應(yīng)用有望快速增長。
目前在商業(yè)化方面,向量數(shù)據(jù)庫行業(yè)還處于市場培育期,Zilliz、Pinecone和騰訊云均推出免費版本的產(chǎn)品給用戶試用。以華為云和星環(huán)科技為代表的廠商在非結(jié)構(gòu)化數(shù)據(jù)處理具有一定技術(shù)積累的基礎(chǔ)上,也相繼推出了向量數(shù)據(jù)庫產(chǎn)品。
其中,星環(huán)科技是國內(nèi)第一批進入向量數(shù)據(jù)庫領(lǐng)域的公司,已經(jīng)與英特爾聯(lián)合發(fā)布向量數(shù)據(jù)庫解決方案。