文丨智能相對論
作者丨沈浪
“我想讓人們知道,是我們(微軟)讓他們(谷歌)‘跳舞’。”
當加入ChatGPT功能的新一代Bing上線,微軟CEO納德拉就已經按耐不住向谷歌發起了挑戰。他認為加入新一代人工智能對搜索是一次重新思考的變革,從現在開始,包括核心排名在內的幾乎所有東西都可以重新想象。
微軟CEO納德拉與OpenAI創始人奧特曼
在AI大模型的加持下,搜索的游戲規則正面臨顛覆性的改變,對應的市場的格局也要重塑。很顯然,如果AI大模型能“上岸”,那么這第一劍大概率就先斬向傳統的搜索巨頭。
在AI大模型的推動下,微軟和谷歌之間的戰爭已經打響,而國內的反應也同樣激烈。
前不久,昆侖萬維推出國內第一款融入大模型的搜索引擎——天工AI搜索,并宣稱“傳統搜索已到了奇點時刻,陳舊的體驗需要被顛覆、被改變”。換句話來說,國內的傳統搜索引擎同樣面臨著新技術的挑戰,也迎來了第一位真正意義上的大模型+搜索產品。
天工AI搜索首頁截圖
事實上,在天工AI搜索之外,國內大多數大模型產品只是沒有明確挑戰傳統搜索引擎,但實際上在做的事情基本都離不開對用戶搜索模式的重塑。
「智能相對論」試用了目前市面上的大多數大模型產品,包括通義千問、訊飛星火、Baichuan-53B,還有文心一言等等。從體驗來看,比起生成式AI,這些大模型產品更成熟的體驗在于對用戶獲取信息模式的優化和升級,也就是搜索引擎一直在做的事情。
然而,以天工AI搜索為代表,融入大模型技術的AI+搜索引擎想要突圍,取代傳統的搜索引擎并沒有那么容易,一方面且不說做大模型產品的廠商就不少,“百模大戰”還在持續,另一方面融入大模型的搜索引擎能否力敵傳統搜索引擎,還有待驗證。天工AI搜索的征程才剛剛開始。
01、搜索增強
搜索增強,正在成為各家大模型廠商首要強化的目標,百度在做,百川智能也在做。
百度副總裁、搜索平臺負責人肖陽認為,“ChatGPT要解決的問題很多就是搜索要解決的問題,它們的目標是一致的。”——什么目標?從目前趨勢來看,應是搜索增強。
百川智能認為,搜索增強是解決模型時效性和幻覺的有效手段,將搜索技術與大語言模型能力結合實現了創新的模型優化,也提升了 AI 回答的可用性。
對此,百川大模型融合了多個模塊,包括指令意圖理解、智能搜索和結果增強等組件。該體系通過深入理解用戶指令,精確驅動查詢詞的搜索,并結合大語言模型技術來優化模型結果生成的可靠性。
本應用在搜索引擎升級上的技術,比如動態超參數調整技術、智能化搜索詞生成、高質量搜索結果篩選、RLHF 搜索結果增強等等,如今用在了大模型預訓練上,由此結合大模型的產品表現,打造出了一個超越傳統搜索引擎的AI搜索應用。
在「智能相對論」體驗文心一言、天工AI搜索等大模型產品的過程中,發現其背后的搜索流程和結果輸出基本都得到了不同程度的強化,帶來不少令人驚艷的搜索體驗。
比如,向文心一言提問“我10月份想去長沙旅游”,結果反饋給出了長沙的知名景點推薦。而在天工AI搜索上,除了景點推薦外,甚至還會給出10月份長沙的天氣情況介紹、美食推薦等其他更詳細的信息。
從這一結果來說,相比傳統搜索引擎,大模型技術加持的智能搜索在兩大方面實現了升級,一是對用戶需求的理解,不再是關鍵詞匹配,更多是一種對話式的交互和理解,覺得說得不夠詳細的,還可以進一步的追問,目前文心一言、天工AI搜索等大模型產品都支持。
二是對結果反饋的優化,省去用戶查找和篩選信息的一大段過程,在大多數情況下AI都能給出相對客觀且準確的答案。同時,文心一言、天工AI搜索等也都會標注相關信息的來源,便于用戶二次確認信息的權威性與準確度。
盡管也會出現一些答非所問或是東拼西湊的回答,但是就現階段的體驗來說,搜索強化下的大模型產品相對傳統搜索引擎,是有著實際性的進步的。
02、傳統的桎梏
進步是有,不足也存在。
隨著體驗越深度,問的問題越多,越會發現當前的大模型產品在搜索上同樣存在著諸多傳統搜索引擎遇到的問題,比如信息的來源、知識的準確性等等。
在目前的搜索體驗上,天工AI搜索會同步給出知識、信息的參考標注,以便用戶進一步確認知識、信息的準確度和權威性。但,「智能相對論」也發現,給出的參考來源大多是知乎、搜狐、新浪財經的,同時根據問題的類別也會出現其他的來源,比如旅游相關會有馬蜂窩、攜程、本地寶的參考標注。
這些網站上的信息有問題嗎?就體驗來說似乎并沒有問題,哪怕我們用傳統搜索引擎,搜出來的結果也大抵如此。
但是,呈現在一個新的產品上,就有較大的問題了。如果新的AI搜索所帶給用戶的信息、知識還和傳統搜索引擎呈現出來的結果差不多,都是些未經驗證的、網友口口相傳的泛泛之談,那么搜索的結果還是沒有得到改善,只是過程變了、形態變了。
百度搜索之所以能長期占據中文互聯網搜索Top1,有著一個非常關鍵的產品在支撐著——百度百科,這個產品的上線很大程度上提高了百度搜索的權威性、準確度。
對于天工AI搜索以及其他大模型產品而言,實際上要建立的同樣也是這種權威性、準確度。作為用戶獲取信息、知識的重要渠道,任何一個產品都需要讓用戶覺得自己的知識、信息是對的、準確的、權威的。
當前,市場上的大模型產品要么只給用戶一個答案,要么像天工AI搜索那樣給出一大堆第三方的來源標注。然而,這兩種模式似乎都不能鞏固用戶對搜索結果的權威感、信任度?;蛟S,在接下來的產品優化上,大模型產品還需要繼續做用戶教育,向用戶證明自家AI給出的答案、知識、信息等是權威的,是科學的。
回過頭來看,正對應肖陽的觀點,ChatGPT和傳統搜索引擎的目標是一致的。
03、新的可能
如果用搜索的視角來看大模型產品,很容易就能看到當前缺什么。那么反過來,如果用大模型的視角來做搜索,或許也會有新的發現——大模型+搜索,應該呈現給用戶什么樣的體驗?
答案絕不會是傳統的搜索引擎。
目前,通用人工智能的一大演進方向是多模態,而在大模型產品上,多模態就重塑了搜索的價值。日前,阿里云推出大規模視覺語言模型Qwen-VL,以通義千問70億參數模型Qwen-7B為基座語言模型研發,支持圖文輸入,具備多模態信息理解能力。
基于Qwen-VL,用戶的搜索體驗得到了升級。比如,一位不懂中文的外國游客到醫院看病,不知怎么去往對應科室,他拍下樓層導覽圖問Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”,Qwen-VL會根據圖片信息給出文字回復。
這是用戶獲取準確信息的一個重要方式,也是搜索,但很顯然,這不同于傳統的搜索引擎。
如同天工AI搜索想實現的跨代際搜索體驗,Qwen-VL正在呈現出新的搜索跨越。
可以想象,在未來的時間內,搜索不再是單一的,而是多模態的、多場景的,比如用戶可以在旅游的過程中隨手拍下一處景點,大模型產品就能給予相關的游玩建議、購票服務等,又或者是用戶在旅游的某個瞬間聽到一首民謠,錄下來也能在大模型產品上搜到相應的歌曲等等。
基于這一趨勢,大模型+搜索所帶來的新體驗將是顛覆的。那個時候,或許搜索的奇點才算是正式到來了。
傳統的搜索引擎將黯然失色,而用戶將在大模型產品的智能搜索下無時無刻不在獲取新的信息、服務和體驗。
*本文圖片均來源于網絡
#智能相對論 Focusing on智能新產業新服務,這是智能的服務NO.237 深度解讀
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。
•AI產業新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
百度于2022年7月27日更新了“百度搜索頁面質量標準”,對“優質內容”進行了重新定義,更準確、更詳細的詮釋了什么是高質量頁面。我大致看了一下,這次搜索引擎優化規則更新還是比較重要的。
title可以設置幾個關鍵詞一個網站title可以設置最多幾個關鍵詞,最少幾個關鍵詞,有限制嗎。從搜索引擎快照展示方面考量:谷歌、百度、360搜索、搜狗搜索等搜索引擎能夠展示的快照字數都是有限制的,title展示字數大概是25個漢字,description大概是3行文字(約莫160個字符左右)。
為什么想到寫這個?一是讓SEO同學們了解下搜索引擎市場占比,二是讓大家不要只盯著做百度SEO!希望對你有幫助或啟發。1、百度搜索引擎市場占比數據
12月1日,阿里云舉辦通義千問發布會,開源通義千問720億參數模型Qwen-72B。Qwen-72B在10個權威基準測評創下開源模型最優成績,成為業界最強開源大模型,性能超越開源標桿Llama2-70B和大部分商用閉源模型。未來,企業級、科研級的高性能應用,也有了開源大模型這一選項。通義千問還開源了
在全球數字化進程的浪潮中,擁有120年歷史的行業領導者西蒙公司站在了最前沿。近日,公司總裁兼首席執行官HenrySiemon先生接受了CDCC的獨家采訪,分享了公司的理念、價值觀以及環保舉措,并深入探討了行業和技術的未來發展趨勢,同時揭示了AI時代下數據中心的現狀與未來。秉持核心價值觀,引領企業發展
12月1日,首屆“通義千問AI挑戰賽”開賽,參賽者可免費暢玩通義開源模型家族,包括剛剛發布的720億參數模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道,前者聚焦通義千問大模型的微調訓練,希望通過高質量的數據探索開源模型的代碼能力上限,后
12月1日通義千問發布會,阿里云開源通義千問720億參數模型Qwen-72B。Qwen-72B在10個權威基準測評創下開源模型最優成績,成為業界最強開源大模型,性能超越開源標桿Llama2-70B和大部分商用閉源模型,可適配企業級、科研級的高性能應用。通義千問當天還開源了18億參數模型Qwen-1.
隨著通信技術和大數據技術的快速發展,中國客服行業經歷了從傳統的電話呼叫中心、單一的網頁在線客服到如今客服系統多元化、智能化的發展變革。尤其是近年來移動互聯網、云計算、AI等技術的突破發展,使越來越多的企業投入建設自己的客服中心,中國智能客服規模逐年增長。中商產業研究院發布的《2023年中國智能客服市
11月25日,聚焦于國內AI創新應用的盛大賽事——2023黑馬AI創新大賽在第十五屆創業家年會上公布了獲獎名單。歷經81天的奮戰角逐,「靈動AI」憑借扎實的技術實力和優秀的服務能力,從200家參賽企業中沖出重圍,榮獲創業黑馬30強。本次大賽由黑馬AIGC產業服務聯盟發起,創業黑馬聯合百度智能云、阿里
當你看到這類是不是就明白一二了?只不過很多人是借了AI的手來回答了一些熱點問題,ChatGPT成了背鍋俠,而這個背鍋俠卻無法反抗。
大部分AIAgent還在講概念談愿景階段,GPTs大受歡迎但問題也不少,這種情況下企服軟件廠商推出AI智能體更被B端客戶器重。
OpenAI推出的GPTs是不是Agent?與AIAgent有什么區別?會不會殺死其他AI智能體?一篇文章看明白。
隨著未來人工智能技術的不斷進步和應用領域的不斷拓展,百度厚積薄發的AI原生應用必將為百度帶來更多的新增量來源。