就在中國股民熱議蘋果公司與某些科技公司洽談AI模型合作的同時(shí),海外投資者則在討論另一個(gè)話題:全球市值最高上市公司的AI,似乎在關(guān)鍵領(lǐng)域不太靠得住。
作為近幾天最熱的案例,英國廣播公司近一周接連發(fā)表報(bào)道,指責(zé)蘋果公司上周在英國上線的“蘋果智能”,錯(cuò)誤地歸納了這家媒體的新聞推送。
截圖顯示,蘋果的AI推送摘要錯(cuò)誤地表示,近期因?yàn)闃寶⒙?lián)合健康保險(xiǎn)公司CEO引發(fā)全球關(guān)注的路易吉·曼喬內(nèi)“對自己開槍”——事實(shí)上并沒有這回事。令媒體機(jī)構(gòu)難以忍受的是,蘋果AI在推送錯(cuò)誤總結(jié)時(shí),看上去還像是BBC新聞終端推送的信息。
事實(shí)上,這并不是一個(gè)孤例。在社交媒體上還有蘋果AI歸納《紐約時(shí)報(bào)》的新聞推送,得出“內(nèi)塔尼亞胡被捕”的虛假結(jié)果。
BBC的發(fā)言人表示,已經(jīng)向蘋果公司表達(dá)了擔(dān)憂,但整整一周還未收到回復(fù)。
類似報(bào)告層出不窮
這次事件的中心是“蘋果智能”的通知摘要功能,引發(fā)這些問題的一個(gè)潛在可能性,會是蘋果用來總結(jié)內(nèi)容的模型——安裝在設(shè)備端的30億參數(shù)量“小”模型能力不足——而且這是蘋果自研的模型,怪不了別人。
蘋果官網(wǎng)發(fā)布的研究也顯示,端側(cè)模型總結(jié)能力的滿意度,大致就在70%左右。雖然結(jié)果比起競品的迷你模型稍好一些,但依然距離“不出重要差錯(cuò)”相去甚遠(yuǎn)。
事實(shí)上,在社交媒體上不乏“蘋果智能”生成的笑話。例如蘋果會總結(jié)智能家居攝像頭的通知,然后在凌晨1點(diǎn)通知用戶——你家的前門、后門和車道上有好多人。
就目前而言,“蘋果智能”的通知摘要還是一個(gè)兼具優(yōu)點(diǎn)和缺點(diǎn),偶爾還能制造一些笑點(diǎn)的工具。但是在時(shí)事新聞?lì)I(lǐng)域,關(guān)鍵信息出錯(cuò)可能會帶來嚴(yán)重的認(rèn)知偏差(想想看如果你下單交易完,發(fā)現(xiàn)手機(jī)總結(jié)的新聞是錯(cuò)的)。
人工智能目前依然是一種“以一定概率生成正確內(nèi)容”的軟件,但信息能否準(zhǔn)確傳播,恐怕不應(yīng)該由概率來決定。