<noframes id="5guqg"><noframes id="5guqg"><delect id="5guqg"><rt id="5guqg"></rt></delect><rt id="5guqg"></rt><rt id="5guqg"><delect id="5guqg"><delect id="5guqg"></delect></delect></rt><noframes id="5guqg"><rt id="5guqg"></rt><noframes id="5guqg"><rt id="5guqg"></rt><noframes id="5guqg"><rt id="5guqg"><delect id="5guqg"></delect></rt><noframes id="5guqg"><rt id="5guqg"><delect id="5guqg"></delect></rt><noframes id="5guqg"><rt id="5guqg"></rt><rt id="5guqg"></rt><noframes id="5guqg"><rt id="5guqg"></rt> <rt id="5guqg"><delect id="5guqg"></delect></rt><noframes id="5guqg"><noframes id="5guqg"><noframes id="5guqg"><noframes id="5guqg"><noframes id="5guqg"><rt id="5guqg"></rt><rt id="5guqg"><rt id="5guqg"></rt></rt><noframes id="5guqg"><noframes id="5guqg"><rt id="5guqg"></rt> <noframes id="5guqg"><rt id="5guqg"></rt><rt id="5guqg"><rt id="5guqg"></rt></rt><noframes id="5guqg"><rt id="5guqg"><rt id="5guqg"></rt></rt><bdo id="5guqg"></bdo><bdo id="5guqg"></bdo><delect id="5guqg"></delect><rt id="5guqg"></rt><bdo id="5guqg"><delect id="5guqg"></delect></bdo><delect id="5guqg"></delect><rt id="5guqg"><noframes id="5guqg">

當前位置:首頁 >  科技 >  IT業界 >  正文

生成式AI時代,亞馬遜云科技如何助力企業全球化創新發展

 2024-05-24 11:51  來源: 互聯網   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

“企業需要的是懂業務、懂用戶的生成式AI應用,而打造這樣的應用需要從數據做起。亞馬遜云科技構建數據基座的三大核心能力涵蓋從基礎模型訓練到生成式AI應用構建的重要場景,能夠幫助企業輕松應對海量多模態數據,提升基礎模型能力。”4月30日,在亞馬遜云科技“無數據不模型——生成式AI時代的數據基座”的媒體溝通會上,亞馬遜云科技大中華區產品部總經理陳曉建強調了數據在生成式AI時代中的關鍵作用。

陳曉建強調,在生成式AI的時代,數據的核心地位不容忽視。若企業欲在這個時代嶄露頭角,必須從數據這一基礎出發,借助自身的數據資源構建具有商業競爭力的AI應用。

陳曉建提出,企業應具備多方面的數據能力。首先,要有處理數據以進行模型微調和預訓練的技術實力;其次,需有能力將專有數據與模型高效結合,從而創造出獨特的商業價值;最后,企業還需擁有對新數據進行有效處理的能力,以推動生成式AI應用的持續快速發展。

簡而言之,企業應在數據處理、數據結合以及新數據應用等方面都具備強大的實力。

01 應對生成式AI的數據挑戰:存儲、清洗與治理的全方位解決方案

生成式AI基礎模型微調和預訓練需要將海量的多樣化原始數據轉化為高質量的大數據集,這對數據存儲、清洗和治理都提出了更嚴峻的挑戰。

在數據存儲方面,擴展性和響應速度是關鍵。Amazon Simple Storage Service(Amazon S3)對象存儲幾乎是云上擴展性的代名詞,它支持廣泛的數據協議,能夠輕松應對各種數據類型,還支持智能分層以降低訓練成本。專門構建的文件存儲服務Amazon FSx for Lustre則能夠提供亞毫秒延遲和數百萬IOPS的吞吐性能,能夠進一步加快模型優化的速度。

在數據清洗方面,企業面臨著繁重的數據清洗加工任務,Amazon EMR Serverless和Amazon Glue可以幫助企業輕松完成數據清理、去重、乃至分詞的操作,讓企業專注于生成式AI業務創新。Amazon EMR serverless采用無服務器架構,幫助企業運行任何規模的分析工作負載,自動擴展功能可在幾秒鐘內調整資源大小,以滿足不斷變化的數據量和處理要求。Amazon Glue是一個簡單可擴展的無服務器數據集成服務,可以輕松快速地完成微調或預訓練模型的數據準備工作。

在數據治理方面,企業難以在多個賬戶和區域中查找數據,也缺乏有效的數據治理工具。Amazon DataZone讓企業能夠跨組織邊界大規模地發現、共享和管理數據,不但能夠為多源多模態數據進行有效編目和治理,而且還提供簡單易用的統一數據管理平臺和工具,從而為用戶解鎖所有數據的潛能。

事實上,通過利用Amazon S3、Amazon FSx for Lustre、Amazon EMR Serverless、Amazon Glue以及Amazon DataZone等亞馬遜云科技的服務,企業可以有效地應對生成式AI基礎模型微調和預訓練過程中的數據存儲、清洗和治理挑戰。

這些服務不僅提供了強大的擴展性和快速響應能力,還通過無服務器架構和智能數據管理功能,大大降低了企業的運維成本和數據處理復雜度。更重要的是,它們為企業釋放了更多的資源和精力,使其能夠更專注于生成式AI的核心業務創新。在這個數據為王的時代,擁有高效、可靠的數據存儲、清洗和治理解決方案,是企業走向成功的關鍵一步。

02 數據與模型快速結合,讓企業專有數據釋放更大價值

億邦動力獲悉,生成式AI基礎模型的局限性之一在于無法及時擁有企業專有數據,因此通過技術手段加速數據與模型的結合成為企業數據基座的第二項關鍵能力。

檢索增強生成(Retrieval-Augmented Generation,RAG)技術被普遍認為是實現數據與模型結合的主要途徑之一,它通過將數據轉換為向量并存儲到向量數據庫中,從而將語義的關聯性轉化為向量間的數學距離問題,以實現內容的關聯性計算?,F代應用程序需精準理解用戶需求并正確關聯產品或內容,這一需求廣泛存在于搜索、評論、購物車及產品推薦等交互框架中,這些框架又依賴于功能各異的數據庫,這使得數據庫成為實施RAG技術的理想平臺。

亞馬遜云科技將向量搜索的支持功能加入到主流的數據服務中,通過將數據和向量存儲在一起來提升數據查詢性能。這能夠讓企業輕松利用RAG技術將專有數據提供給基礎模型,從而釋放更大價值。此外,亞馬遜云科技還為圖數據庫Amazon Neptune推出了分析數據庫引擎,以結合圖數據庫與大模型的優勢,從而能夠快速從圖形數據中獲取洞察,并進行更快的向量搜索。

實際上,通過采用檢索增強生成(RAG)技術,亞馬遜云科技成功地將數據與模型緊密結合,打破了生成式AI基礎模型無法及時獲取企業專有數據的局限。這一創新不僅提升了數據查詢性能,還使得企業能夠輕松地將專有數據融入基礎模型,從而釋放出更大的商業價值。

此外,通過為圖數據庫Amazon Neptune推出分析數據庫引擎,亞馬遜云科技進一步融合了圖數據庫與大模型的優勢,為企業提供了從圖形數據中快速獲取洞察并進行更快向量搜索的能力。這些技術進步不僅代表著數據與模型結合的新高度,更預示著企業在生成式AI領域將迎來前所未有的發展機遇。

值得一提的是,店匠科技也在生成式AI領域取得了顯著的突破和創新。他們的全球化工作主要集中在四個場景:首先是GenAl營銷素材創作,通過生成式AI技術,店匠科技能夠高效地創作出富有創意和吸引力的全球化營銷素材;其次是AI建站Copilot,這一技術使得網站的建設更加智能化和個性化;再者是智能客服,通過AI驅動的客服系統,店匠科技提供了更加便捷和高效的用戶支持;最后是智能推薦&搜索,利用AI算法,店匠科技顯著提升了用戶體驗和購物轉化率,助力跨境電商企業揚帆出海。

這些創新不僅展示了店匠科技在生成式AI技術方面的深厚實力,也預示著零售行業在AI技術的推動下,正迎來前所未有的變革和發展機遇。

03 提升生成式AI效率:優化數據處理與模型調用

對生成式AI應用程序而言,基礎模型頻繁調用將會導致成本的增加和響應的延遲,因此如何處理生成式AI應用程序新生成的數據,提升模型調用效率成為企業數據基座的第三項關鍵能力。Amazon Memory DB內存數據庫通過緩存之前問答生成的新數據,實現對類似問題的快速響應和準確回答,同時有效降低基礎模型的調用頻率。

據悉,Amazon Memory DB能夠存儲數百萬個向量,只需要幾毫秒的響應時間,能夠以99%的召回率實現每秒百萬次的查詢性能。

此外,生成式AI應用程序需要快速占領市場。亞馬遜云科技通過提供無服務器數據庫服務和Amazon OpenSearch Serverless用于向量搜索,最大限度為企業減少運維負擔和成本,消除性能瓶頸,使企業能夠專注于生成式AI業務創新。

通過這些服務,企業可以更高效地處理和利用數據,加速模型的訓練和優化,同時降低成本和提高響應速度。例如,Amazon Music通過分析用戶和歌曲的特征,并將它們轉換成向量以提高推薦精準度。Amazon Music已通過Amazon OpenSearch將1億首歌曲編碼成向量并進行索引,以為全球用戶提供實時音樂推薦。Amazon Music目前在Amazon OpenSearch中管理著10.5億個向量,并能夠處理每秒高達7100次的查詢峰值,有效支撐其推薦系統。

總結來說,生成式AI時代的企業需要重視數據的收集、處理和應用,利用先進的云服務和數據處理技術,構建強大的數據基座,以支持AI應用的持續創新和發展。亞馬遜云科技提供的服務和解決方案,為企業提供了一個全面的數據管理平臺,幫助企業在競爭激烈的市場中占據優勢,實現數據驅動的業務增長。

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關文章

熱門排行

信息推薦