北京 2025年7月1日 /美通社/ -- IBM 正在從根本上簡(jiǎn)化面向 AI 的數(shù)據(jù)堆棧。IBM 在Think大會(huì)上預(yù)覽 watsonx.data 的重大演進(jìn),以幫助組織做好數(shù)據(jù)準(zhǔn)備為AI所用,同時(shí)提供一個(gè)開放的混合數(shù)據(jù)基礎(chǔ)架構(gòu)和企業(yè)級(jí)的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)管理。
測(cè)試結(jié)果顯示,與傳統(tǒng)RAG相比,IBM watsonx.data的AI準(zhǔn)確性提高了40%。IBM于6月推出的產(chǎn)品和功能包括:
Watsonx.data 集成和 Watsonx.data 智能將作為獨(dú)立產(chǎn)品提供,部分功能也將通過 Watsonx.data 提供,從而最大限度地提高客戶選擇和模塊化程度。
為了補(bǔ)充這些產(chǎn)品,IBM 近期宣布了收購(gòu) DataStax 的意向,DataStax 擅長(zhǎng)將非結(jié)構(gòu)化數(shù)據(jù)用于生成式AI。借助 DataStax,客戶可以訪問其他矢量搜索功能。
基于內(nèi)部測(cè)試,對(duì)比使用 watsonx.data Premium Edition 檢索層與僅矢量 RAG 在三個(gè)常見用例中 AI 模型輸出答案的準(zhǔn)確性,測(cè)試使用 IBM 專有數(shù)據(jù)集,采用相同的選定開源通用推理、評(píng)估和嵌入模型以及額外變量。測(cè)試結(jié)果可能因具體情況而異。
這一重大演進(jìn)的背景
企業(yè)正面臨著實(shí)現(xiàn)準(zhǔn)確且高性能的生成式AI——尤其是具有自主決策能力的智能體AI人的重大障礙,但該障礙并非如大多數(shù)企業(yè)領(lǐng)導(dǎo)者所想。
問題不在于推理成本或難以捉摸的"完美"模型。問題在于數(shù)據(jù)。
企業(yè)需要可信且具有公司特性的數(shù)據(jù),才能讓智能體AI真正創(chuàng)造價(jià)值——這些數(shù)據(jù)存在于電子郵件、文檔、演示文稿和視頻等非結(jié)構(gòu)化數(shù)據(jù)中。據(jù)估計(jì),2022年企業(yè)產(chǎn)生的數(shù)據(jù)中90%是非結(jié)構(gòu)化數(shù)據(jù),但I(xiàn)BM預(yù)測(cè)其中僅有1%為大型語言模型(LLMs)所用。
非結(jié)構(gòu)化數(shù)據(jù)的利用往往面臨巨大挑戰(zhàn)。這類數(shù)據(jù)分布廣泛且動(dòng)態(tài)變化,存儲(chǔ)于多種格式中,缺乏清晰的標(biāo)簽,且常需額外上下文才能完整解讀。傳統(tǒng)檢索增強(qiáng)生成(RAG)技術(shù)難以有效提取其價(jià)值,也無法妥善整合非結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)。
與此同時(shí),各類孤立的工具會(huì)使AI數(shù)據(jù)處理架構(gòu)變得復(fù)雜且繁瑣。企業(yè)需要同時(shí)管理數(shù)據(jù)倉(cāng)庫、數(shù)據(jù)湖以及數(shù)據(jù)治理和數(shù)據(jù)集成工具。數(shù)據(jù)架構(gòu)可能與它本應(yīng)管理的非結(jié)構(gòu)化數(shù)據(jù)一樣令人困惑。
許多組織并未解決根本問題。它們僅關(guān)注生成式AI的應(yīng)用層,而非其下方的核心數(shù)據(jù)層。除非組織修復(fù)其數(shù)據(jù)基礎(chǔ)架構(gòu),否則AI智能體和其他生成式AI計(jì)劃將無法充分發(fā)揮其潛力。
幫助組織實(shí)現(xiàn)數(shù)據(jù)的AI 就緒
IBM提供的新功能將使組織能夠采集、治理和檢索非結(jié)構(gòu)化(及結(jié)構(gòu)化)數(shù)據(jù)——在此基礎(chǔ)上,實(shí)現(xiàn)準(zhǔn)確、高性能的生成式AI的規(guī)?;瘧?yīng)用。
關(guān)于 IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個(gè)國(guó)家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡(jiǎn)化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過數(shù)千家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和紅帽 OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對(duì)企業(yè)誠(chéng)信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長(zhǎng)期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請(qǐng)?jiān)L問:https://www.ibm.com/cn-zh