悅暢小說 > 職場小聰明 > 第603章 機器學習裡的分類問題和迴歸問題,一個故事解釋

第603章 機器學習裡的分類問題和迴歸問題,一個故事解釋

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
⭐ 加入書籤
推薦閱讀: 花都風流第一兵王 代嫁寵妻是替身 天鋒戰神 穿越古代賺錢養娃 我覺醒了神龍血脈 我的老婆國色天香 隱婚嬌妻別想跑 遲遲也歡喜 全職獵人之佔蔔師

用故事解釋分類問題和迴歸問題

1.分類問題的故事——森林裡的神秘果子

在一片神秘的森林裡,小明發現了許多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一個方法來區分這些果子。

他觀察到:

?顏色:紅色的果子通常是可食用的,紫色的果子通常是有毒的。

?形狀:圓形的果子大多能吃,尖尖的果子往往有毒。

?大小:太小的果子似乎更危險。

於是,小明決定建立一個“吃不吃果子”的規則係統:

?如果果子是紅色且圓形,就吃!

?如果是紫色且尖尖的,就不吃!

?其他情況要謹慎判斷。

這個過程就是分類問題——它的目標是給每個果子打上一個“可吃”或“不可吃”的標簽。

分類問題的典型特征:

答案是離散的類彆(例如:“可吃”vs.“不可吃”)

數據用於區分不同類彆(紅色vs.紫色,圓形vs.尖形)

最終輸出是一個標簽(1=可吃,0=不可吃)

現實中的應用:

?郵件是否是垃圾郵件?(垃圾vs.非垃圾)

?貸款申請者是否值得批準?(批準vs.拒絕)

?識彆圖片中的動物是什麼?(貓vs.狗)

2.迴歸問題的故事——小明賣檸檬水

夏天到了,小明在街頭賣檸檬水。他想預測明天應該準備多少杯檸檬水,以免浪費或賣不夠。

他發現:

?溫度越高,賣出的檸檬水越多。

?天氣越晴朗,賣出的檸檬水也越多。

?濕度太高時,人們反而不太想買檸檬水。

他收集了一些數據,比如:

?昨天30°C,賣出50杯

?昨天35°C,賣出70杯

?昨天28°C,賣出45杯

他想建立一個預測模型,比如:

這樣,如果明天預測是32°C,他可以計算:

那麼,他就應該準備大約76杯檸檬水。

這個過程就是迴歸問題——它的目標是預測一個連續的數值,而不是一個固定類彆。

迴歸問題的典型特征:

答案是一個數值,而不是分類標簽(如“明天賣76杯”而不是“賣得多”或“賣得少”)

數據之間有連續性的關係(溫度從20°C到40°C,銷量隨之變化)

最終輸出是一個數值預測(如“銷量=76”)

現實中的應用:

?預測房價(基於麵積、地段等因素預測房價)

?預測股票價格(基於曆史數據預測未來走勢)

?預測某人未來的收入(基於年齡、教育、工作經驗等)

用比喻解釋分類問題和迴歸問題

1.分類問題——“選擇哪種衣服?”

想象你站在衣櫃前,思考今天穿什麼衣服。你會根據天氣決定:

?晴天→穿T恤

?下雨→穿雨衣

?下雪→穿羽絨服

這是一個分類問題,因為你的決策結果是幾個固定選項之一(T恤、雨衣、羽絨服)。

2.迴歸問題——“決定穿多厚?”

如果你不僅要決定穿什麼,還想確定該穿多厚的衣服,就成了迴歸問題。

你會想:

?10°C,應該穿厚毛衣+外套(厚度8分)

?20°C,應該穿薄外套(厚度5分)

?30°C,應該穿短袖(厚度2分)

這樣,你的決定不隻是T恤\/雨衣\/羽絨服,而是一個連續數值(衣服的厚度),這就類似於迴歸問題。

總結

對比點分類問題迴歸問題

輸出類型固定類彆(離散值)連續數值

目標識彆類彆(蘋果or橘子)預測數值(溫度vs.檸檬水銷量)

典型應用垃圾郵件分類、疾病診斷房價預測、銷量預測

示例這封郵件是垃圾郵件嗎?(是\/否)明天應該賣多少杯檸檬水?(75杯)

分類問題適合選出某個類彆,而迴歸問題適合預測一個數值。希望這些比喻能幫你更容易理解它們的區彆!

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
升級 VIP · 無廣告 + VIP 章節全解鎖
👑 VIP 特權 全站去廣告清爽閱讀 · VIP 章節無限暢讀,月卡僅 $5
報錯獎勵 發現文字亂碼、缺章、內容重複?點上方「章節報錯」回報,審核通過立獲 3天VIP
書單獎勵 前往 個人中心 投稿你的私藏書單,審核通過立獲 7天VIP
⭐ 立即升級 VIP · 月卡僅 $5
還沒有帳號? 免費註冊 | 登入後購買