文心一言向社會全面開放,到底是誰需要誰?
8月30日晚間,百度旗下AI大模型文心一言宣布向全社會全面開放,所有用戶都可以體驗這款AI大模型了。
8月31日的時候,百度方面又公開表示,開放下載12小時后,文心一言App登上了蘋果商店免費榜榜首,成為首個登頂的中文AI原生應用。
【資料圖】
與此同時有多家媒體報道稱,國內將有11家大模型陸續通過審批備案,從8月31日起陸續向全社會公眾開放服務。顯然,文心一言是其中最早與用戶見面的那個。
相關的消息也受到了互聯網、科技圈的聚焦關注,各類觀點、分析、報道層出不窮。不過雖然互聯網、科技圈嗨了,但似乎普通用戶對文心一言乃至整個AI大模型的感知都并不高。
PConline隨機詢問了多位非互聯網、科技圈的用戶,普遍表示并不了解文心一言以及眾多AI大模型,即便對于此前爆火的AI大模型ChatGPT, 也僅僅只是聽過名字而已,對于具體的功能內容并不了解。
從數據來看也是如此,更多的人或許還并不了解和關注AI大模型。百度搜索指數顯示,文心一言、ChatGPT的相關搜索熱度始終保持著較為平緩的曲線,并未出現太大的波動,而從熱度數值的對比來說,則是遠遠低于抖音這樣的主流App應用。
這其實與大模型尚處于發展早期,相關平臺還需要經歷長期的迭代完善,缺乏現象級的應用與用戶產生連接等方面有關。即使是如今面向社會開放的文心一言,也還有許多不盡如人意的地方。
按照百度方面的介紹,文心一言并非倉促上馬的項目,而是經歷了數年的發展積淀。文心一言的基礎模型文心大模型發布于2019年,近期升級的文心大模型3.5也持續在十余個國內外權威測評中位居第一。
例如今年7月據多家媒體報道,人民數據研究院選取文心一言、訊飛星火、通義千問、ChatGPT四個主流AI大模型進行評測,結果顯示文心一言排名第一。
從評測維度可以看到,在內容生態、數據認知、邏輯推理等方面,文心一言均有著一定的優勢能力。這其實不難理解,畢竟百度深耕AI領域多年,有著很強的AI技術積累,作為頭部搜索平臺,在大數據方面自然也是有著一定優勢的。
不過雖然文心一言在各類測評中取得了好成績,但在實際的使用體驗上仍然有不少被用戶吐槽的地方, 其AI智能程度也似乎并未達到部分用戶的預期。
例如在文心一言榜單登頂的蘋果商店中,按照時間順序查看到的用戶評論幾乎都為負面,主要集中在答非所問、內容錯誤等方面。PConline也發現,在華為應用商店、vivo應用商店的文心一言評論區,同樣出現了不少類似的吐槽評論。
PConline在實際體驗中也發現了一些事實錯誤的情況,同時也有一些表現得不夠智能,不夠出彩的地方。
例如PConline在百度搜索里找到了一張羅納爾多的照片,拿來問文心一言時得到的回復卻是貝利。
同樣的,PConline在百度搜索中獲取了一張姆巴佩的照片,文心一言通過一番推理,用一種不太確定的口吻回答說這人可能是姆巴佩。與此同時,法國隊并未獲得2022年世界杯冠軍,即便在2018年奪冠的那一屆,也不存在制勝一球的說法,法國隊4粒進球中也只有一球來自于姆巴佩, 所以無論從哪個維度來說,文心一言給出的信息都算不上準確。
在文心一言宣傳中提到的寫文章功能上,PConline在簡單的測試中發現結果似乎并不太智能。
PConline用今年暑期曾備受關注的上海迪士尼門票爭議的新聞話題,讓文心一言寫一篇文章,得到的內容只能說是一篇較為初級的分析文章,重點是全文完全沒有提到此前發生的一些新聞事件和輿論爭議內容,而這些恰恰是百度搜索引擎中最容易獲取到的信息數據。
在體驗中PConline還遇到了一個有趣的小插曲,當你問類似 “百度遇到過什么失敗” 等與百度公司相關的非正面話題時,文心一言要么拒絕回答,要么直接結束對話。但當同樣的問題,主體換成其他企業時,文心一言會正常給出回答內容。
當然,作為百度開發的一款AI大模型,維護百度的形象、避開百度的一些負面內容,這并沒有什么問題,但如果能在這方面也保持客觀公正的態度,像回答阿里失敗案例那樣坦然回答百度過往的一些不足的話,就可以視為“出彩”的表現了。
回到文心一言被吐槽的內容錯誤問題上。 “AI大模型怎么總會給出錯誤答案?” 有意思的是,PConline也將這個問題拋給了文心一言,得到了一個頗為誠實的回答。
文心一言將原因分為了這幾點。 首先是數據訓練不足,AI大模型的準確性與其所依賴的數據訓練密切相關,如果訓練數據不足或不夠多樣化,AI大模型可能無法準確解析結果。
第二點是語義理解存在一定的挑戰。AI模型往往是通過深度學習算法來學習和理解文字、圖像等內容形式的,這個過程存在著非常多的困難和挑戰。比如當面對抽象畫或有著多重含義的內容時,AI大模型可能無法進行準確的解析。
文心一言也表示,為了克服這些問題,研究人員可以通過增加訓練數據、改進模型架構和提高算法精度等方式來優化AI大模型。同時對于含有特定語義信息的圖像,如抽象畫,可以通過額外的標注或特定的訓練來提高模型的解析能力。
簡單來說,AI大模型想要變得越來越完善,越來越好用,就需要更強的大數據庫,更精準的訓練算法,更高強度的使用頻次。
那么該如何更好地解決這些問題呢?AI領域有一個十分直白的法則,“人多力量大”。不妨試想一下, 面向大眾開放,讓海量的用戶參與到使用中來,是不是能滿足這幾大關鍵條件?
用一個故事可以很好地理解這一點。人工智能、計算機視覺科學家李飛飛曾在2009年就發表過一篇論文,講述了來自全球167個國家近5萬名工作者,以眾包的方式通過三年努力,人工標注出了1500萬圖像。
正是這5萬人的努力,讓AI產業收獲了一個有標志性意義的數據集,這龐大規模的標注性數據,對AI領域中的計算機視覺技術的發展,起到了極為重要的推動作用。
無獨有偶,在游戲領域,一款網絡游戲在正式上線運行之前,必須要經歷內測和公測階段。顧名思義,公測就是公開測試的意思,主要就是為了邀請更多的用戶參與進來,側重于客戶端可能出現的問題,測試服務器的性能和查找程序的BUG等等,是產品正式上線運營以及不斷迭代優化的必要環節。
所以簡單來說,大家可以把文心一言此次的“對全社會開放”理解為公測, 只有越來越多的用戶參與進來,不斷使用文心一言,產生越來越多的使用體驗、反饋意見等數據,才能讓文心一言更好地完善功能、迭代發展。
實際上,從文心一言的功能設計也能看出用戶的真實體驗和反饋對其AI大模型發展的重要性。幾乎在每一次與用戶的交互后,文心一言都會出現一個比較醒目的按鈕圖標,方便用戶對回答內容和交互體驗的評價,用戶可以點擊贊或者踩,無論點擊哪一個按鈕,文心一言都會彈出新的窗口,希望用戶能更為詳細地記錄和反饋真實意見。
其實百度創始人李彥宏說的一段話也值得大家關注, “當文心一言向數以億計互聯網用戶大規模開放服務后,能夠獲得大量真實世界中的人工反饋,這將進一步改進基礎模型,并以更快速度迭代文心一言,創造更好的用戶體驗。”
這段話其實也意味著,所謂的百度文心一言向全社會全面開放,并不是百度單方面給予社會、用戶的一項利好,用戶的體驗和反饋,對于百度文心一言來說或許才有著更為重要的意義和價值。
但PConline需要指出一個十分重要的地方,文心一言在面向全社會開放的階段,是否更應該先完善好信息錯誤這個最核心的問題,而不是指望在后續的用戶使用中,讓用戶來幫忙完成。
不妨想想, 如果這是一款新上市的汽車, 廠家跟消費者說,我們的車子可能會偶爾失靈、失控、開到錯誤的路上,我們的車子還存在很多安全漏洞,不完善的地方,希望各位消費者在后續的使用體驗中多多反饋這些問題......那么這家汽車廠商還有存在的必要嗎?
回看文心一言,用戶在使用過程中如果得到的信息和內容本身就存在錯漏,會引發的負面后果是難以估量的,尤其在文心一言對全社會開放, 大量的用戶涌入后,這樣的風險和危害性或將成倍增長。
試想一下,如果每天有一定數量的虛假、錯誤內容經由AI大模型傳遞給了海量的用戶,會出現怎樣的后果?最直接的就是會出現無數個現代版的“三人成虎”案例,嚴重的話會導致整個互聯網空間充斥著謠言、虛假新聞、錯誤信息等不可信內容。
量子位就曾在一篇相關報道中,將這樣的現象稱為 “AI正在污染中文互聯網”。
簡單來說,AI生成的內容并不是憑空而來的,而是需要一定的信息素材作為基礎。當AI因為各種原因生成了錯誤、虛假信息后,這些信息又可能成為另一個AI生成內容時的素材。
當互聯網空間充斥著AI制造的垃圾信息后,這種無限套娃式的AI信息傳遞,就會變成一個輸入和輸出都是垃圾信息的死循環,這是一個十分可怕的糟糕局面。
這不僅僅是文心一言,而是所有AI大模型都必須要重視的問題。
其實無論文心一言還是其他的AI大模型,都需要回答一個核心的問題, 為什么用戶需要你,你憑什么能替代原有的工具平臺。
比如PConline在文心一言中提問李白是誰,文心一言給出的只有兩段十分簡要的介紹。但在百度等傳統的主流搜索引擎中搜索這個問題后,用戶可以得到十分豐富的內容展現,無論圖片、視頻、文章等多元化的呈現形式,還是從李白到杜甫,再到盛唐歷史等更有創造性地內容延伸,體驗感和需求滿足等維度,都是文心一言這樣的AI大模型所無法比擬的。
說到這里PConline必須指出文心一言一個必須引起重視的隱患問題。 文心一言在App中還提供了一個“發現”專區,里面有著非常豐富的預設主題和場景,顯示為“靈感小工具”,觀察來看是幫助用戶更好地使用文心一言的功能,可以有效地提升用戶的使用場景和需求頻次。
但PConline也在其中發現了不少游走于違規邊緣的所謂AI大模型使用場景。 比如AI生成淘寶評論、外賣評論、小紅書種草文案、小紅書探店文案、知乎回答等,而這些恰恰是各大平臺目前嚴打的虛假內容。
比如點開“知乎回答生成”這個所謂的靈感小工具,就會進入到一個預設好的對話框,文心一言會提供一些預設的問題讓用戶選擇,然后自動模仿知乎平臺的回答內容生成文案,用戶也可以自由發揮,提出指定的問題讓文心一言生成AI答案。
可以毫不夸張地說,理論上AI大模型在工具屬性和用戶體驗上能為用戶帶來巨大的效率提升和想象空間,但也存在著被刻意利用,造成網絡空間信息污染,不法商業牟利等惡果的風險。
總而言之,要避免這個情況,還是得回到本文一再強調的問題上。用戶為什么需要AI大模型?讓這個世界變得更好,AI大模型能提供怎樣的可能性?如何鎖住AI大模型可能產生的“惡”?
需要思考的問題還有很多很多,期待未來文心一言以及更多的AI大模型們,能交出一個盡可能完美的答卷。
關鍵詞:
您可能也感興趣:
今日熱點
為您推薦
用一生認識魯迅
年輕人變美有新選擇!這部權威報告將揭曉答案
揚州千億級汽車產業再添新引擎
排行
最近更新
- 文心一言向社會全面開放,到底是誰需要誰?
- 人工智能在無人機競速領域戰勝人類冠軍
- 持續排查!擰緊燃氣“安全閥”
- 重疾險能拿回本金嗎?
- 百萬雕像錢從哪來必須要查到底
- 天津公積金提取出新規 9月1日起這些情況可提取
- 仁懷市鹽津街道:“強組興村”工作隊多措并舉助力學子圓夢
- 德柏金2023年上半年凈利-114.32萬 虧損減少55.71%
- 永超新材2023年上半年凈利1737.03萬 同比增加82.17%
- 家家樂2023年上半年凈利991.87萬 同比增加649.76%
- 海思科:擬收購控股子公司股權
- 受臺風“蘇拉”影響,廣鐵集團9月3日前停運列車近4000列
- 上坤地產上半年收入9.12億元 歸母凈虧損同比減虧37.2%
- 百克生物(688276)公司深度研究:國產帶皰疫苗首家 差異化管...
- 華潤有巢:已從存量和增量兩方面規劃可持續的擴募計劃
- 廣東惠州官宣:9月1日起“認房不認貸”
- 被控受賄4832萬余元!上海市人民檢察院原檢察長張本才案開庭
- 男子家新裝曬衣架必須夾子音控制 網友:這才是求人辦事的態度
- 大摩料華潤置地股價15日內將會上升
- 2023小微夜經濟觀察報告:除了夜宵,還有哪些商業機會?
- 白俄羅斯總統盧卡申科:要求瓦格納撤離白俄羅斯的要求是毫無...
- 廈門發布海浪和風暴潮黃色警報
- 南京銀行跌4% 墊底銀行板塊
- 國防部回應海軍054B新型護衛艦下水:按照計劃正常安排
- 總是出現cdudflib.dll加載錯誤如何解決
- 破發股奧浦邁跌4.52% 去年上市超募10億海通證券保薦
- 年度大片《開學》震撼上映!這份安全指南請收好
- “三臺共舞”如何應對?專家提醒秋臺風不可小覷
- 明日起存款利率全線下調?多家銀行客戶經理發預告,有人冒雨...
- 微信又更新!有多個新變化