淺談人工智能局限性

「AI點解會唔識串STRAWBERRY?」

近日網上突然出現大量關於AI唔識串「strawberry」嘅梗圖,究竟係咩一回事? 喺呢個科技日新月異嘅時代,人工智能(AI)嘅發展可以話係一日千里。不過最近網上卻出現咗一個有趣嘅現象-就係連最先進嘅AI都唔識點樣正確串「strawberry」呢個字!呢件事令到好多人都感到驚訝同時又覺得好好笑。今日就等我哋一齊來探討下背後嘅原因,睇下AI到底點解會出現呢個咁基本嘅錯誤。

AI點解會唔識串「strawberry」?

首先我哋要明白,雖然AI睇落好似無所不能,但其實佢哋嘅運作方式同人類嘅思考模式係完全唔同㗎。就好似最近幾個著名嘅AI系統,包括GPT-4同Claude,佢哋都認為「strawberry」呢個字入面只有兩個「r」字母。咁究竟係點解呢?

AI嘅運作原理

要了解呢個問題,我哋首先要知道AI係點樣運作㗎。

大部分嘅大型語言模型(LLMs)都係建基於一種叫做「transformer」嘅深度學習架構。

呢種模型會將文字拆解成一個個「token」,可以係完整嘅字、音節或者字母,視乎個模型而定。

Alberta大學嘅AI研究員MatthewGuzdial解釋話:「LLMs基於transformer架構,佢哋其實唔係真正咁去閱讀文字。當你輸入一個提示時,佢會被轉換成一種編碼。」

換句話講,當AI見到「the」呢個字嘅時候,佢只係將佢當成一個整體嘅編碼,而唔係分開理解「T」、「H」、「E」呢三個字母。

為咩會咁樣?

呢個問題嘅根源其實係因為transformer模型唔能夠有效率咁處理真正嘅文字。

相反,佢哋會將文字轉換成數字表示,然後根據上下文嚟推斷出一個合理嘅回應。

舉個例,AI可能知道「straw」同「berry」組成「strawberry」呢個字,但佢未必明白「strawberry」係由「s」、「t」、「r」、「a」、「w」、「b」、「e」、「r」、「r」、「y」呢十個字母按特定順序組成㗎。所以佢就唔能夠準確咁話你知「strawberry」入面究竟有幾多個字母,更加唔知入面有幾多個「r」。

呢個問題容唔容易解決?

唔少人可能會諗,咁咪加強AI嘅訓練囉,等佢學識正確咁串字囉。但事實上,呢個問題並冇咁容易解決㗎。

結構性嘅局限

呢個問題其實已經深深咁植根喺LLMs嘅基本架構之中。

Northeastern大學研究LLM可解釋性嘅博士生SheridanFeucht就話:「要為語言模型定義一個『字』到底係咩其實好困難,就算人類專家都好難就呢個問題達成共識。」

佢仲補充話:「就算我哋搵到一個完美嘅token詞彙表,模型可能都會覺得進一步『分塊』會更加有用。」

多語言嘅挑戰

當AI學習更多語言嘅時候,呢個問題就會變得更加複雜。

例如,有啲tokenization方法可能會假設句子中嘅空格一定代表新嘅字詞開始。

但係好多語言例如中文、日文、泰文、老撾文、韓文同高棉文等等都唔係用空格嚟分隔字詞㗎。

GoogleDeepMind嘅AI研究員YennieJun喺2023年嘅一項研究中發現,有啲語言需要用多達10倍嘅token數量先至可以表達同英文一樣嘅意思。

所以呢個問題唔係淨係影響英文㗎喎,仲會影響到AI處理其他語言嘅能力添!

影像生成AI又點?

講完文字AI,大家可能會諗,咁影像生成AI又點呢?例如Midjourney同DALL-E呢啲影像生成AI,佢哋會唔會都有類似嘅問題呢?

影像生成AI嘅運作原理

影像生成AI同文字AI其實係用唔同嘅技術㗎。佢哋通常會用「擴散模型」(diffusionmodels),呢種模型會從雜訊中重建影像。擴散模型會喺大量影像資料庫上進行訓練,然後嘗試重新創造類似佢哋喺訓練資料中學到嘅嘢。

影像生成AI嘅局限

DAIRInstitute嘅研究員AsmelashTekaHadgu解釋話:「影像生成器喺處理汽車同人臉呢啲大型物件嘅時候表現會好啲,但喺處理手指同手寫字呢啲細節嘅時候就會差啲。」呢個可能係因為喺訓練數據集入面,呢啲細節出現嘅機會比較少。相比之下,好似樹葉通常係綠色呢啲概念就會經常出現。

有改善嘅空間

不過,影像生成AI嘅問題可能會比文字AI更加容易解決。例如,有啲影像生成器通過訓練更多真實人手嘅影像,已經改善咗佢哋喺表現手部細節方面嘅能力。Guzdial指出:「就好似去年,所有呢啲模型喺處理手指嘅時候都做得好差,呢個問題同文字嘅問題其實係一樣㗎。佢哋而家喺局部處理方面做得好好,如果你單獨睇一隻有六七隻手指嘅手,你可能會話『哇,呢隻真係好似手指』。同樣地,喺生成嘅文字入面,你可能會話,呢個睇落好似個『H』,嗰個睇落好似個『P』,但佢哋喺將呢啲嘢組合埋一齊嘅時候就做得好差。」

AI嘅未來發展

雖然而家AI仲有好多局限,但科技公司一直都喺努力改進緊。例如OpenAI就喺開發緊一個代號叫「Strawberry」嘅新AI產品,據聞呢個產品喺推理能力方面會更加出色。

OpenAI嘅新計劃

OpenAI嘅新計劃「Strawberry」可以生成準確嘅合成數據,用嚟進一步改善佢哋嘅LLMs。根據TheInformation嘅報導,Strawberry可以解開紐約時報嘅Connections字謎遊戲,呢個遊戲需要創意思考同識別規律先至可以完成㗎。而且Strawberry仲可以解決佢以前冇見過嘅數學方程式添。

Google DeepMind嘅新突破

另一方面,GoogleDeepMind最近推出咗AlphaProof同AlphaGeometry2呢兩個專門用嚟做正式數學推理嘅AI系統。Google話呢兩個系統成功解開咗國際數學奧林匹克競賽六道題目中嘅四道,呢個成績已經足以喺呢個享負盛名嘅比賽中贏得銀牌喎。

總結

雖然而家喺網上充斥住關於AI唔識串「strawberry」嘅梗圖,但其實我哋唔應該小看AI嘅能力。反而我哋應該明白到,AI嘅運作方式同人類係好唔同㗎。佢哋喺某啲方面可能表現得好出色,但喺一啲對人類嚟講好簡單嘅任務上可能會顯得笨拙。

AI的優點及缺點

AI雖然強大,但都有佢嘅局限性
我哋唔應該將AI當成全能嘅存在
人類嘅智慧同創意仲係好重要㗎
我哋要適當咁運用AI,而唔係完全依賴佢

隨住科技嘅不斷進步,相信AI喺將來一定會變得更加強大同智能。但係喺呢個過程中,我哋都要時刻保持警惕,明白AI嘅優點同缺點,從而更好咁利用呢個強大嘅工具。最後,等我哋繼續保持好奇心,睇下AI未來仲會帶畀我哋咩驚喜同挑戰啦!

加入AI群組

持續學習如何使用AI協助提升產出優質市場營銷內容的效率，可免費領取我們的AI工具大全及加入我們的AI群組。

加入AI群組

淺談人工智能局限性「AI點解會唔識串STRAWBERRY?」

淺談人工智能局限性

「AI點解會唔識串STRAWBERRY?」

AI點解會唔識串「strawberry」?

AI嘅運作原理

為咩會咁樣?

呢個問題容唔容易解決?

結構性嘅局限

多語言嘅挑戰

影像生成AI又點?

影像生成AI嘅運作原理

影像生成AI嘅局限

有改善嘅空間

AI嘅未來發展

OpenAI嘅新計劃

Google DeepMind嘅新突破

總結

加入AI群組

發佈留言取消回覆

淺談人工智能局限性「AI點解會唔識串STRAWBERRY?」

淺談人工智能局限性

「AI點解會唔識串STRAWBERRY?」

AI點解會唔識串「strawberry」?

AI嘅運作原理

為咩會咁樣?

呢個問題容唔容易解決?

結構性嘅局限

多語言嘅挑戰

影像生成AI又點?

影像生成AI嘅運作原理

影像生成AI嘅局限

有改善嘅空間

AI嘅未來發展

OpenAI嘅新計劃

Google DeepMind嘅新突破

總結

加入AI群組

發佈留言 取消回覆

發佈留言取消回覆