文心一言向社會(huì)全面開(kāi)放，到底是誰(shuí)需要誰(shuí)？

2023-09-01 09:52:43 來(lái)源: PConline太平洋科技

8月30日晚間，百度旗下AI大模型文心一言宣布向全社會(huì)全面開(kāi)放，所有用戶(hù)都可以體驗(yàn)這款A(yù)I大模型了。

8月31日的時(shí)候，百度方面又公開(kāi)表示，開(kāi)放下載12小時(shí)后，文心一言App登上了蘋(píng)果商店免費(fèi)榜榜首，成為首個(gè)登頂?shù)闹形腁I原生應(yīng)用。

【資料圖】

與此同時(shí)有多家媒體報(bào)道稱(chēng)，國(guó)內(nèi)將有11家大模型陸續(xù)通過(guò)審批備案，從8月31日起陸續(xù)向全社會(huì)公眾開(kāi)放服務(wù)。顯然，文心一言是其中最早與用戶(hù)見(jiàn)面的那個(gè)。

相關(guān)的消息也受到了互聯(lián)網(wǎng)、科技圈的聚焦關(guān)注，各類(lèi)觀(guān)點(diǎn)、分析、報(bào)道層出不窮。不過(guò)雖然互聯(lián)網(wǎng)、科技圈嗨了，但似乎普通用戶(hù)對(duì)文心一言乃至整個(gè)AI大模型的感知都并不高。

PConline隨機(jī)詢(xún)問(wèn)了多位非互聯(lián)網(wǎng)、科技圈的用戶(hù)，普遍表示并不了解文心一言以及眾多AI大模型，即便對(duì)于此前爆火的AI大模型ChatGPT，也僅僅只是聽(tīng)過(guò)名字而已，對(duì)于具體的功能內(nèi)容并不了解。

從數(shù)據(jù)來(lái)看也是如此，更多的人或許還并不了解和關(guān)注AI大模型。百度搜索指數(shù)顯示，文心一言、ChatGPT的相關(guān)搜索熱度始終保持著較為平緩的曲線(xiàn)，并未出現(xiàn)太大的波動(dòng)，而從熱度數(shù)值的對(duì)比來(lái)說(shuō)，則是遠(yuǎn)遠(yuǎn)低于抖音這樣的主流App應(yīng)用。

這其實(shí)與大模型尚處于發(fā)展早期，相關(guān)平臺(tái)還需要經(jīng)歷長(zhǎng)期的迭代完善，缺乏現(xiàn)象級(jí)的應(yīng)用與用戶(hù)產(chǎn)生連接等方面有關(guān)。即使是如今面向社會(huì)開(kāi)放的文心一言，也還有許多不盡如人意的地方。

按照百度方面的介紹，文心一言并非倉(cāng)促上馬的項(xiàng)目，而是經(jīng)歷了數(shù)年的發(fā)展積淀。文心一言的基礎(chǔ)模型文心大模型發(fā)布于2019年，近期升級(jí)的文心大模型3.5也持續(xù)在十余個(gè)國(guó)內(nèi)外權(quán)威測(cè)評(píng)中位居第一。

例如今年7月?lián)嗉颐襟w報(bào)道，人民數(shù)據(jù)研究院選取文心一言、訊飛星火、通義千問(wèn)、ChatGPT四個(gè)主流AI大模型進(jìn)行評(píng)測(cè)，結(jié)果顯示文心一言排名第一。

從評(píng)測(cè)維度可以看到，在內(nèi)容生態(tài)、數(shù)據(jù)認(rèn)知、邏輯推理等方面，文心一言均有著一定的優(yōu)勢(shì)能力。這其實(shí)不難理解，畢竟百度深耕AI領(lǐng)域多年，有著很強(qiáng)的AI技術(shù)積累，作為頭部搜索平臺(tái)，在大數(shù)據(jù)方面自然也是有著一定優(yōu)勢(shì)的。

不過(guò)雖然文心一言在各類(lèi)測(cè)評(píng)中取得了好成績(jī)，但在實(shí)際的使用體驗(yàn)上仍然有不少被用戶(hù)吐槽的地方，其AI智能程度也似乎并未達(dá)到部分用戶(hù)的預(yù)期。

例如在文心一言榜單登頂?shù)奶O(píng)果商店中，按照時(shí)間順序查看到的用戶(hù)評(píng)論幾乎都為負(fù)面，主要集中在答非所問(wèn)、內(nèi)容錯(cuò)誤等方面。PConline也發(fā)現(xiàn)，在華為應(yīng)用商店、vivo應(yīng)用商店的文心一言評(píng)論區(qū)，同樣出現(xiàn)了不少類(lèi)似的吐槽評(píng)論。

PConline在實(shí)際體驗(yàn)中也發(fā)現(xiàn)了一些事實(shí)錯(cuò)誤的情況，同時(shí)也有一些表現(xiàn)得不夠智能，不夠出彩的地方。

例如PConline在百度搜索里找到了一張羅納爾多的照片，拿來(lái)問(wèn)文心一言時(shí)得到的回復(fù)卻是貝利。

同樣的，PConline在百度搜索中獲取了一張姆巴佩的照片，文心一言通過(guò)一番推理，用一種不太確定的口吻回答說(shuō)這人可能是姆巴佩。與此同時(shí)，法國(guó)隊(duì)并未獲得2022年世界杯冠軍，即便在2018年奪冠的那一屆，也不存在制勝一球的說(shuō)法，法國(guó)隊(duì)4粒進(jìn)球中也只有一球來(lái)自于姆巴佩，所以無(wú)論從哪個(gè)維度來(lái)說(shuō)，文心一言給出的信息都算不上準(zhǔn)確。

在文心一言宣傳中提到的寫(xiě)文章功能上，PConline在簡(jiǎn)單的測(cè)試中發(fā)現(xiàn)結(jié)果似乎并不太智能。

PConline用今年暑期曾備受關(guān)注的上海迪士尼門(mén)票爭(zhēng)議的新聞話(huà)題，讓文心一言寫(xiě)一篇文章，得到的內(nèi)容只能說(shuō)是一篇較為初級(jí)的分析文章，重點(diǎn)是全文完全沒(méi)有提到此前發(fā)生的一些新聞事件和輿論爭(zhēng)議內(nèi)容，而這些恰恰是百度搜索引擎中最容易獲取到的信息數(shù)據(jù)。

在體驗(yàn)中PConline還遇到了一個(gè)有趣的小插曲，當(dāng)你問(wèn)類(lèi)似 “百度遇到過(guò)什么失敗” 等與百度公司相關(guān)的非正面話(huà)題時(shí)，文心一言要么拒絕回答，要么直接結(jié)束對(duì)話(huà)。但當(dāng)同樣的問(wèn)題，主體換成其他企業(yè)時(shí)，文心一言會(huì)正常給出回答內(nèi)容。

當(dāng)然，作為百度開(kāi)發(fā)的一款A(yù)I大模型，維護(hù)百度的形象、避開(kāi)百度的一些負(fù)面內(nèi)容，這并沒(méi)有什么問(wèn)題，但如果能在這方面也保持客觀(guān)公正的態(tài)度，像回答阿里失敗案例那樣坦然回答百度過(guò)往的一些不足的話(huà)，就可以視為“出彩”的表現(xiàn)了。

回到文心一言被吐槽的內(nèi)容錯(cuò)誤問(wèn)題上。 “AI大模型怎么總會(huì)給出錯(cuò)誤答案？” 有意思的是，PConline也將這個(gè)問(wèn)題拋給了文心一言，得到了一個(gè)頗為誠(chéng)實(shí)的回答。

文心一言將原因分為了這幾點(diǎn)。首先是數(shù)據(jù)訓(xùn)練不足，AI大模型的準(zhǔn)確性與其所依賴(lài)的數(shù)據(jù)訓(xùn)練密切相關(guān)，如果訓(xùn)練數(shù)據(jù)不足或不夠多樣化，AI大模型可能無(wú)法準(zhǔn)確解析結(jié)果。

第二點(diǎn)是語(yǔ)義理解存在一定的挑戰(zhàn)。AI模型往往是通過(guò)深度學(xué)習(xí)算法來(lái)學(xué)習(xí)和理解文字、圖像等內(nèi)容形式的，這個(gè)過(guò)程存在著非常多的困難和挑戰(zhàn)。比如當(dāng)面對(duì)抽象畫(huà)或有著多重含義的內(nèi)容時(shí)，AI大模型可能無(wú)法進(jìn)行準(zhǔn)確的解析。

文心一言也表示，為了克服這些問(wèn)題，研究人員可以通過(guò)增加訓(xùn)練數(shù)據(jù)、改進(jìn)模型架構(gòu)和提高算法精度等方式來(lái)優(yōu)化AI大模型。同時(shí)對(duì)于含有特定語(yǔ)義信息的圖像，如抽象畫(huà)，可以通過(guò)額外的標(biāo)注或特定的訓(xùn)練來(lái)提高模型的解析能力。

簡(jiǎn)單來(lái)說(shuō)，AI大模型想要變得越來(lái)越完善，越來(lái)越好用，就需要更強(qiáng)的大數(shù)據(jù)庫(kù)，更精準(zhǔn)的訓(xùn)練算法，更高強(qiáng)度的使用頻次。

那么該如何更好地解決這些問(wèn)題呢？AI領(lǐng)域有一個(gè)十分直白的法則，“人多力量大”。不妨試想一下，面向大眾開(kāi)放，讓海量的用戶(hù)參與到使用中來(lái)，是不是能滿(mǎn)足這幾大關(guān)鍵條件？

用一個(gè)故事可以很好地理解這一點(diǎn)。人工智能、計(jì)算機(jī)視覺(jué)科學(xué)家李飛飛曾在2009年就發(fā)表過(guò)一篇論文，講述了來(lái)自全球167個(gè)國(guó)家近5萬(wàn)名工作者，以眾包的方式通過(guò)三年努力，人工標(biāo)注出了1500萬(wàn)圖像。

正是這5萬(wàn)人的努力，讓AI產(chǎn)業(yè)收獲了一個(gè)有標(biāo)志性意義的數(shù)據(jù)集，這龐大規(guī)模的標(biāo)注性數(shù)據(jù)，對(duì)AI領(lǐng)域中的計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展，起到了極為重要的推動(dòng)作用。

無(wú)獨(dú)有偶，在游戲領(lǐng)域，一款網(wǎng)絡(luò)游戲在正式上線(xiàn)運(yùn)行之前，必須要經(jīng)歷內(nèi)測(cè)和公測(cè)階段。顧名思義，公測(cè)就是公開(kāi)測(cè)試的意思，主要就是為了邀請(qǐng)更多的用戶(hù)參與進(jìn)來(lái)，側(cè)重于客戶(hù)端可能出現(xiàn)的問(wèn)題，測(cè)試服務(wù)器的性能和查找程序的BUG等等，是產(chǎn)品正式上線(xiàn)運(yùn)營(yíng)以及不斷迭代優(yōu)化的必要環(huán)節(jié)。

所以簡(jiǎn)單來(lái)說(shuō)，大家可以把文心一言此次的“對(duì)全社會(huì)開(kāi)放”理解為公測(cè)，只有越來(lái)越多的用戶(hù)參與進(jìn)來(lái)，不斷使用文心一言，產(chǎn)生越來(lái)越多的使用體驗(yàn)、反饋意見(jiàn)等數(shù)據(jù)，才能讓文心一言更好地完善功能、迭代發(fā)展。

實(shí)際上，從文心一言的功能設(shè)計(jì)也能看出用戶(hù)的真實(shí)體驗(yàn)和反饋對(duì)其AI大模型發(fā)展的重要性。幾乎在每一次與用戶(hù)的交互后，文心一言都會(huì)出現(xiàn)一個(gè)比較醒目的按鈕圖標(biāo)，方便用戶(hù)對(duì)回答內(nèi)容和交互體驗(yàn)的評(píng)價(jià)，用戶(hù)可以點(diǎn)擊贊或者踩，無(wú)論點(diǎn)擊哪一個(gè)按鈕，文心一言都會(huì)彈出新的窗口，希望用戶(hù)能更為詳細(xì)地記錄和反饋真實(shí)意見(jiàn)。

其實(shí)百度創(chuàng)始人李彥宏說(shuō)的一段話(huà)也值得大家關(guān)注， “當(dāng)文心一言向數(shù)以?xún)|計(jì)互聯(lián)網(wǎng)用戶(hù)大規(guī)模開(kāi)放服務(wù)后，能夠獲得大量真實(shí)世界中的人工反饋，這將進(jìn)一步改進(jìn)基礎(chǔ)模型，并以更快速度迭代文心一言，創(chuàng)造更好的用戶(hù)體驗(yàn)。”

這段話(huà)其實(shí)也意味著，所謂的百度文心一言向全社會(huì)全面開(kāi)放，并不是百度單方面給予社會(huì)、用戶(hù)的一項(xiàng)利好，用戶(hù)的體驗(yàn)和反饋，對(duì)于百度文心一言來(lái)說(shuō)或許才有著更為重要的意義和價(jià)值。

但PConline需要指出一個(gè)十分重要的地方，文心一言在面向全社會(huì)開(kāi)放的階段，是否更應(yīng)該先完善好信息錯(cuò)誤這個(gè)最核心的問(wèn)題，而不是指望在后續(xù)的用戶(hù)使用中，讓用戶(hù)來(lái)幫忙完成。

不妨想想，如果這是一款新上市的汽車(chē)，廠(chǎng)家跟消費(fèi)者說(shuō)，我們的車(chē)子可能會(huì)偶爾失靈、失控、開(kāi)到錯(cuò)誤的路上，我們的車(chē)子還存在很多安全漏洞，不完善的地方，希望各位消費(fèi)者在后續(xù)的使用體驗(yàn)中多多反饋這些問(wèn)題......那么這家汽車(chē)廠(chǎng)商還有存在的必要嗎？

回看文心一言，用戶(hù)在使用過(guò)程中如果得到的信息和內(nèi)容本身就存在錯(cuò)漏，會(huì)引發(fā)的負(fù)面后果是難以估量的，尤其在文心一言對(duì)全社會(huì)開(kāi)放，大量的用戶(hù)涌入后，這樣的風(fēng)險(xiǎn)和危害性或?qū)⒊杀对鲩L(zhǎng)。

試想一下，如果每天有一定數(shù)量的虛假、錯(cuò)誤內(nèi)容經(jīng)由AI大模型傳遞給了海量的用戶(hù)，會(huì)出現(xiàn)怎樣的后果？最直接的就是會(huì)出現(xiàn)無(wú)數(shù)個(gè)現(xiàn)代版的“三人成虎”案例，嚴(yán)重的話(huà)會(huì)導(dǎo)致整個(gè)互聯(lián)網(wǎng)空間充斥著謠言、虛假新聞、錯(cuò)誤信息等不可信內(nèi)容。

量子位就曾在一篇相關(guān)報(bào)道中，將這樣的現(xiàn)象稱(chēng)為 “AI正在污染中文互聯(lián)網(wǎng)”。

簡(jiǎn)單來(lái)說(shuō)，AI生成的內(nèi)容并不是憑空而來(lái)的，而是需要一定的信息素材作為基礎(chǔ)。當(dāng)AI因?yàn)楦鞣N原因生成了錯(cuò)誤、虛假信息后，這些信息又可能成為另一個(gè)AI生成內(nèi)容時(shí)的素材。

當(dāng)互聯(lián)網(wǎng)空間充斥著AI制造的垃圾信息后，這種無(wú)限套娃式的AI信息傳遞，就會(huì)變成一個(gè)輸入和輸出都是垃圾信息的死循環(huán)，這是一個(gè)十分可怕的糟糕局面。

這不僅僅是文心一言，而是所有AI大模型都必須要重視的問(wèn)題。

其實(shí)無(wú)論文心一言還是其他的AI大模型，都需要回答一個(gè)核心的問(wèn)題，為什么用戶(hù)需要你，你憑什么能替代原有的工具平臺(tái)。

比如PConline在文心一言中提問(wèn)李白是誰(shuí)，文心一言給出的只有兩段十分簡(jiǎn)要的介紹。但在百度等傳統(tǒng)的主流搜索引擎中搜索這個(gè)問(wèn)題后，用戶(hù)可以得到十分豐富的內(nèi)容展現(xiàn)，無(wú)論圖片、視頻、文章等多元化的呈現(xiàn)形式，還是從李白到杜甫，再到盛唐歷史等更有創(chuàng)造性地內(nèi)容延伸，體驗(yàn)感和需求滿(mǎn)足等維度，都是文心一言這樣的AI大模型所無(wú)法比擬的。

說(shuō)到這里PConline必須指出文心一言一個(gè)必須引起重視的隱患問(wèn)題。文心一言在A(yíng)pp中還提供了一個(gè)“發(fā)現(xiàn)”專(zhuān)區(qū)，里面有著非常豐富的預(yù)設(shè)主題和場(chǎng)景，顯示為“靈感小工具”，觀(guān)察來(lái)看是幫助用戶(hù)更好地使用文心一言的功能，可以有效地提升用戶(hù)的使用場(chǎng)景和需求頻次。

但PConline也在其中發(fā)現(xiàn)了不少游走于違規(guī)邊緣的所謂AI大模型使用場(chǎng)景。比如AI生成淘寶評(píng)論、外賣(mài)評(píng)論、小紅書(shū)種草文案、小紅書(shū)探店文案、知乎回答等，而這些恰恰是各大平臺(tái)目前嚴(yán)打的虛假內(nèi)容。

比如點(diǎn)開(kāi)“知乎回答生成”這個(gè)所謂的靈感小工具，就會(huì)進(jìn)入到一個(gè)預(yù)設(shè)好的對(duì)話(huà)框，文心一言會(huì)提供一些預(yù)設(shè)的問(wèn)題讓用戶(hù)選擇，然后自動(dòng)模仿知乎平臺(tái)的回答內(nèi)容生成文案，用戶(hù)也可以自由發(fā)揮，提出指定的問(wèn)題讓文心一言生成AI答案。

可以毫不夸張地說(shuō)，理論上AI大模型在工具屬性和用戶(hù)體驗(yàn)上能為用戶(hù)帶來(lái)巨大的效率提升和想象空間，但也存在著被刻意利用，造成網(wǎng)絡(luò)空間信息污染，不法商業(yè)牟利等惡果的風(fēng)險(xiǎn)。

總而言之，要避免這個(gè)情況，還是得回到本文一再?gòu)?qiáng)調(diào)的問(wèn)題上。用戶(hù)為什么需要AI大模型？讓這個(gè)世界變得更好，AI大模型能提供怎樣的可能性？如何鎖住AI大模型可能產(chǎn)生的“惡”？

需要思考的問(wèn)題還有很多很多，期待未來(lái)文心一言以及更多的AI大模型們，能交出一個(gè)盡可能完美的答卷。

關(guān)鍵詞：

文心一言向社會(huì)全面開(kāi)放，到底是誰(shuí)需要誰(shuí)？

您可能也感興趣:

今日熱點(diǎn)

分析機(jī)構(gòu)：2023 年全球移動(dòng)端游戲收入將達(dá) 1080 億美元、PC 游...

建昌恒昌村鎮(zhèn)銀行董事長(zhǎng)徐春雨任職資格獲準(zhǔn)

中鋼天源(002057.SZ)：上半年凈利降13.93%至1.70億元

更多

更多

排行

最近更新

今日要聞

文心一言向社會(huì)全面開(kāi)放，到底是誰(shuí)需要誰(shuí)？

您可能也感興趣:

今日熱點(diǎn)

分析機(jī)構(gòu)：2023 年全球移動(dòng)端游戲收入將達(dá) 1080 億美元、PC 游...

建昌恒昌村鎮(zhèn)銀行董事長(zhǎng)徐春雨任職資格獲準(zhǔn)

中鋼天源(002057.SZ)：上半年凈利降13.93%至1.70億元

為您推薦

土耳其經(jīng)濟(jì)放緩幅度小于預(yù)期 央行有底氣繼續(xù)加息

用一生認(rèn)識(shí)魯迅

年輕人變美有新選擇！這部權(quán)威報(bào)告將揭曉答案

揚(yáng)州千億級(jí)汽車(chē)產(chǎn)業(yè)再添新引擎

更多

更多

排行

最近更新

今日要聞

土耳其經(jīng)濟(jì)放緩幅度小于預(yù)期央行有底氣繼續(xù)加息