淺談人工智能局限性

「AI點解會唔識串STRAWBERRY?」

近日網上突然出現大量關於AI唔識串「strawberry」嘅梗圖,究竟係咩一回事? 喺呢個科技日新月異嘅時代,人工智能(AI)嘅發展可以話係一日千里。不過最近網上卻出現咗一個有趣嘅現象-就係連最先進嘅AI都唔識點樣正確串「strawberry」呢個字!呢件事令到好多人都感到驚訝同時又覺得好好笑。今日就等我哋一齊來探討下背後嘅原因,睇下AI到底點解會出現呢個咁基本嘅錯誤。

AI點解會唔識串「strawberry」?

首先我哋要明白,雖然AI睇落好似無所不能,但其實佢哋嘅運作方式同人類嘅思考模式係完全唔同㗎。就好似最近幾個著名嘅AI系統,包括GPT-4同Claude,佢哋都認為「strawberry」呢個字入面只有兩個「r」字母。咁究竟係點解呢?

AI嘅運作原理

AI運作原理

要了解呢個問題,我哋首先要知道AI係點樣運作㗎。

大部分嘅大型語言模型(LLMs)都係建基於一種叫做「transformer」嘅深度學習架構。

呢種模型會將文字拆解成一個個「token」,可以係完整嘅字、音節或者字母,視乎個模型而定。

Alberta大學嘅AI研究員MatthewGuzdial解釋話:「LLMs基於transformer架構,佢哋其實唔係真正咁去閱讀文字。當你輸入一個提示時,佢會被轉換成一種編碼。」

換句話講,當AI見到「the」呢個字嘅時候,佢只係將佢當成一個整體嘅編碼,而唔係分開理解「T」、「H」、「E」呢三個字母。

為咩會咁樣?

呢個問題嘅根源其實係因為transformer模型唔能夠有效率咁處理真正嘅文字。

相反,佢哋會將文字轉換成數字表示,然後根據上下文嚟推斷出一個合理嘅回應。

舉個例,AI可能知道「straw」同「berry」組成「strawberry」呢個字,但佢未必明白「strawberry」係由「s」、「t」、「r」、「a」、「w」、「b」、「e」、「r」、「r」、「y」呢十個字母按特定順序組成㗎。所以佢就唔能夠準確咁話你知「strawberry」入面究竟有幾多個字母,更加唔知入面有幾多個「r」。

呢個問題容唔容易解決?

唔少人可能會諗,咁咪加強AI嘅訓練囉,等佢學識正確咁串字囉。但事實上,呢個問題並冇咁容易解決㗎。

結構性嘅局限

呢個問題其實已經深深咁植根喺LLMs嘅基本架構之中。

Northeastern大學研究LLM可解釋性嘅博士生SheridanFeucht就話:「要為語言模型定義一個『字』到底係咩其實好困難,就算人類專家都好難就呢個問題達成共識。」

佢仲補充話:「就算我哋搵到一個完美嘅token詞彙表,模型可能都會覺得進一步『分塊』會更加有用。」

多語言嘅挑戰

AI多語言的挑戰

當AI學習更多語言嘅時候,呢個問題就會變得更加複雜。

例如,有啲tokenization方法可能會假設句子中嘅空格一定代表新嘅字詞開始。

但係好多語言例如中文、日文、泰文、老撾文、韓文同高棉文等等都唔係用空格嚟分隔字詞㗎。

GoogleDeepMind嘅AI研究員YennieJun喺2023年嘅一項研究中發現,有啲語言需要用多達10倍嘅token數量先至可以表達同英文一樣嘅意思。

所以呢個問題唔係淨係影響英文㗎喎,仲會影響到AI處理其他語言嘅能力添!

影像生成AI又點?

講完文字AI,大家可能會諗,咁影像生成AI又點呢?例如Midjourney同DALL-E呢啲影像生成AI,佢哋會唔會都有類似嘅問題呢?

影像生成AI嘅運作原理

影像生成AI同文字AI其實係用唔同嘅技術㗎。佢哋通常會用「擴散模型」(diffusionmodels),呢種模型會從雜訊中重建影像。擴散模型會喺大量影像資料庫上進行訓練,然後嘗試重新創造類似佢哋喺訓練資料中學到嘅嘢。

影像生成AI嘅局限

DAIRInstitute嘅研究員AsmelashTekaHadgu解釋話:「影像生成器喺處理汽車同人臉呢啲大型物件嘅時候表現會好啲,但喺處理手指同手寫字呢啲細節嘅時候就會差啲。」呢個可能係因為喺訓練數據集入面,呢啲細節出現嘅機會比較少。相比之下,好似樹葉通常係綠色呢啲概念就會經常出現。

有改善嘅空間

不過,影像生成AI嘅問題可能會比文字AI更加容易解決。例如,有啲影像生成器通過訓練更多真實人手嘅影像,已經改善咗佢哋喺表現手部細節方面嘅能力。Guzdial指出:「就好似去年,所有呢啲模型喺處理手指嘅時候都做得好差,呢個問題同文字嘅問題其實係一樣㗎。佢哋而家喺局部處理方面做得好好,如果你單獨睇一隻有六七隻手指嘅手,你可能會話『哇,呢隻真係好似手指』。同樣地,喺生成嘅文字入面,你可能會話,呢個睇落好似個『H』,嗰個睇落好似個『P』,但佢哋喺將呢啲嘢組合埋一齊嘅時候就做得好差。」

AI嘅未來發展

雖然而家AI仲有好多局限,但科技公司一直都喺努力改進緊。例如OpenAI就喺開發緊一個代號叫「Strawberry」嘅新AI產品,據聞呢個產品喺推理能力方面會更加出色。

OpenAI嘅新計劃

OpenAI嘅新計劃「Strawberry」可以生成準確嘅合成數據,用嚟進一步改善佢哋嘅LLMs。根據TheInformation嘅報導,Strawberry可以解開紐約時報嘅Connections字謎遊戲,呢個遊戲需要創意思考同識別規律先至可以完成㗎。而且Strawberry仲可以解決佢以前冇見過嘅數學方程式添。

Google DeepMind嘅新突破

另一方面,GoogleDeepMind最近推出咗AlphaProof同AlphaGeometry2呢兩個專門用嚟做正式數學推理嘅AI系統。Google話呢兩個系統成功解開咗國際數學奧林匹克競賽六道題目中嘅四道,呢個成績已經足以喺呢個享負盛名嘅比賽中贏得銀牌喎。

總結

雖然而家喺網上充斥住關於AI唔識串「strawberry」嘅梗圖,但其實我哋唔應該小看AI嘅能力。反而我哋應該明白到,AI嘅運作方式同人類係好唔同㗎。佢哋喺某啲方面可能表現得好出色,但喺一啲對人類嚟講好簡單嘅任務上可能會顯得笨拙。

AI多語言的挑戰

AI的優點及缺點

隨住科技嘅不斷進步,相信AI喺將來一定會變得更加強大同智能。但係喺呢個過程中,我哋都要時刻保持警惕,明白AI嘅優點同缺點,從而更好咁利用呢個強大嘅工具。最後,等我哋繼續保持好奇心,睇下AI未來仲會帶畀我哋咩驚喜同挑戰啦!

加入AI群組

持續學習如何使用AI協助提升產出優質市場營銷內容的效率,可免費領取我們的AI工具大全及加入我們的AI群組。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *