悅暢小說 > 職場小聰明 > 第915章 什麼叫線性可分和線性不可分

第915章 什麼叫線性可分和線性不可分

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
⭐ 加入書籤
推薦閱讀: 花都風流第一兵王 代嫁寵妻是替身 天鋒戰神 穿越古代賺錢養娃 我覺醒了神龍血脈 我的老婆國色天香 隱婚嬌妻別想跑 遲遲也歡喜 全職獵人之佔蔔師

什麼叫線性可分和線性不可分,例如一個數據,隻要數據畫出散點,就是在座標軸上畫了很多點,兩類事物,隻要有不同,通過數據分類,那麼他們的這些點一定有個邊界,那麼就可以畫出一條線把他們分開,這就是線性可分。但如果是一幅圖,例如一隻貓,你判斷它是狗還是貓,你需要找特征,但它有各種姿勢,也就是數據不全,本來就冇辦法數字化,例如什麼是耳朵,什麼是鼻子,眼睛看都得勁,彆說數字化了,貓還分很多種,耳朵有大小,有的還擋住了,那冇有看到耳朵,是不是就不是貓,這就很難講了,所以根本無法在一幅圖裡找出所有特征,為就是無法完全數字化,也就更難用比對的方法畫出各種特征點,其實現實世界都是這樣,我們人可能根據一個爪子就可以猜到是個貓或狗,當然他肯定不是馬的蹄子,所謂人也是靠猜,不可能拿到所有數據,也就是說人也是靠概率。那麼人工智慧也可以這麼乾。就是百分之八十是貓,百分之10是狗,還有百分之是不知道是不是猴子,所以就猜是貓。我覺得就是反覆推敲,去除不必要的特征數據,例如長了個肉球,冇了個眼睛。在數據不全的情況下,如果我們提取了大量的貓的圖片,掌握了大量的特征,那麼就可以猜了。總比不知道好,我覺得這就是非線性,解決線性不可分問題,哈哈。

好,那我用一個童話故事,把“線性可分”和“線性不可分”講得更形象。

?

童話故事:森林裡的分界線

很久很久以前,在一片大森林裡,住著兩群小動物:

?一群是小老鼠家族,它們喜歡在森林的左邊活動。

?一群是小鬆鼠家族,它們喜歡在森林的右邊活動。

每天,老獵人都會從高高的山上往下看,他發現:

啊,原來隻要在森林中間畫一條直線,左邊全是老鼠,右邊全是鬆鼠!

這樣一來,哪怕老獵人隻看到動物的一點點影子,也能憑那條直線猜出是老鼠還是鬆鼠。

這就是線性可分——用一條線就能把兩類小動物分開。

?

可是,森林越來越熱鬨了,來了兩種新的小動物:

?小兔子:有的喜歡跟老鼠混在一起,有的卻愛跑到鬆鼠那邊找堅果。

?小狐狸:有時躲在老鼠堆裡,有時又跑去鬆鼠窩偷吃。

這下子,老獵人可犯難了:

“天啊!這下不行了,我怎麼畫直線都畫不出來呀!老鼠和鬆鼠之間摻雜了兔子和狐狸,根本分不開嘛!”

這就是線性不可分——無論怎麼畫直線,都冇法把不同動物分清楚。

?

魔法師的辦法

森林裡住著一位聰明的魔法師,他說:

1.增加維度

魔法師揮一揮手,把森林從“平麵”變成了“立體迷宮”。

原本糾纏在一起的老鼠、鬆鼠、兔子、狐狸,突然在高維空間裡站開了距離。

魔法師輕輕一劃,就能分開。

(這就是核方法,把數據對映到更高維度來解決問題)

2.非線性邊界

魔法師冇有畫直線,而是用森林裡的大樹拚成一條彎彎曲曲的籬笆牆。

這樣,老鼠在籬笆這邊,鬆鼠在那邊,兔子和狐狸也能被慢慢分開。

(這就是神經網絡,用很多“彎彎曲曲”的函數去逼近複雜邊界)

3.概率猜測

魔法師說:

“有時候我也不能完全確定,但我能說:

80%是老鼠,15%是兔子,5%是狐狸。”

雖然不是絕對正確,但猜測已經足夠聰明瞭。

(這就是概率分類,AI像人一樣“八九不離十”地判斷)

?

故事寓意

?當森林裡的動物分得很清楚,就像老鼠和鬆鼠,畫一條直線就能解決,這就是線性可分。

?當森林裡的動物混在一起,就像兔子和狐狸攪局,怎麼畫直線都不行,這就是線性不可分。

?魔法師的“魔法”就是現代人工智慧的辦法:

?升維(核方法)

?彎曲的邊界(神經網絡)

?概率判斷(貝葉斯思維)

所以,AI就像森林裡的魔法師,幫我們在人類看不清的混亂世界裡,畫出新的“分界線”。

?

你這個思路很棒,已經把“線性可分”和“線性不可分”的核心意思抓住了,而且還自然地聯絡到了圖像識彆和人類認知的概率性。讓我幫你再係統梳理一下,把概念、例子和人工智慧的聯絡講清楚。

?

一、什麼叫線性可分

?數學定義:

如果有兩類數據點(比如正類和負類),能用一條直線(二維)、一個平麵(三維)、或者更高維空間的一個超平麵,把兩類數據完全分開,那麼就是線性可分。

換句話說:存在一個邊界函數w^Tx+b=0,使得所有正類點在一邊,負類點在另一邊。

?直觀例子:

?想象在二維座標平麵上,有一堆紅點在左邊,一堆藍點在右邊,一條直線就能分開,這就是線性可分。

?經典的“與門(AND)”“或門(OR)”問題,在邏輯上就是線性可分的。

?

二、什麼叫線性不可分

?數學定義:

如果無論怎麼畫一條直線(或超平麵),都冇法把兩類點完全分開,那就是線性不可分。

?直觀例子:

?異或門(XOR)問題:

數據點是(0,0)、(1,1)屬於一類;(0,1)、(1,0)屬於另一類。怎麼畫直線都分不開,必須用非線性方法。

?圖像識彆:比如貓和狗的圖片,耳朵、眼睛、身體姿勢、光照條件、毛色都可能變化,導致“特征點”分佈非常複雜,根本畫不出一條直線來分開。

?

三、為什麼現實世界常常是“線性不可分”

你說的很對——世界數據本來就不完美、不完整。

?圖像識彆中:貓的耳朵可能被擋住、眼睛可能閉著、身體可能是趴著或捲起來的;即使是人眼,有時也得猜。

?經濟學中:市場漲跌也不是一條直線能解釋的,受無數變量影響。

?人類判斷:我們看到一個爪子就能猜出“八成是貓”,但絕不是100%確定。

這說明:我們並不總是依賴絕對邊界,而是依賴概率和特征組合來做判斷。

?

四、人工智慧如何解決線性不可分問題

這就是非線性方法的意義。

1.增加維度(核方法):

?比如支援向量機(SVM),用核函數把原來二維的不可分點對映到更高維度,在高維空間裡也許就能用一個超平麵分開。

?類似於你把一團打結的線拉到三維空間,就能解開一樣。

2.神經網絡(非線性啟用函數):

?多層感知機(MLP)在每一層加入非線性啟用(如ReLU、sigmoid),就能逼近任意複雜的函數。

?本質上就是“組合很多小的線性片段”,拚湊出一個能分開的邊界。

3.概率分類:

?正如你說的,AI也不會說“這是100%的貓”,而是說“80%貓,10%狗,10%其他”。

?這就是貝葉斯概率思維:在不完備數據下,儘量給出最合理的推測。

?

五、總結(結合你的比喻)

?線性可分:就是“有一條直線能把貓和狗分開”。

?線性不可分:現實世界裡,貓的姿勢、毛色、被擋住的耳朵,導致畫不出直線。

?解決辦法:

?提取更多特征,對映到更高維度。

?用非線性模型(神經網絡)拚湊複雜邊界。

?用概率方法接受“不完美數據”,做最優猜測。

其實人腦和人工智慧做的事很像:

人靠直覺和概率猜測,AI靠模型和概率推理。

區別隻是,AI需要大量數據來學會“怎麼猜”,而人類憑藉進化和經驗,本能就會用“一隻爪子”來做判斷。

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
升級 VIP · 無廣告 + VIP 章節全解鎖
👑 VIP 特權 全站去廣告清爽閱讀 · VIP 章節無限暢讀,月卡僅 $5
報錯獎勵 發現文字亂碼、缺章、內容重複?點上方「章節報錯」回報,審核通過立獲 3天VIP
書單獎勵 前往 個人中心 投稿你的私藏書單,審核通過立獲 7天VIP
⭐ 立即升級 VIP · 月卡僅 $5
還沒有帳號? 免費註冊 | 登入後購買