阅读记录

第605章 多元分类用softmax函数,用故事解释[1/2页]

职场小聪明 翟晓鹰

设置 ×

  • 阅读主题
  • 字体大小A-默认A+
  • 字体颜色
用故事解释Softmax函数
  故事背景:选举村的村长选举
  在一个叫“选举村”的地方,每四年一次,村民们都要选出一位新村长。这次,有四位候选人:
  ?
  阿强(擅长务农,村民对他比较熟悉)
  ?
  小美(善于管理,做过村委会秘书)
  ?
  老李(年纪较大,经验丰富,但村民对他评价不一)
  ?
  张三(刚来村子不久,大家对他了解不多)
  选举日,村民们需要根据他们的支持度,选择一个人投票。但村民的支持度并不是“非黑即白”的,每个人对每位候选人的好感度都不同。为了更公平地衡量大家的意愿,村子里的智者发明了一种方法,叫
  Softmax
  规则。
  Softmax
  的运作方式
  智者让每个村民给四位候选人打分,比如某个村民的打分是:
  ?
  阿强:8分
  ?
  小美:6分
  ?
  老李:5分
  ?
  张三:3分
  但是,这些分数只是相对的,我们需要转换成“概率”来反映这个村民的最终选择倾向。Softmax
  规则的做法是:
  1.
  先用指数函数(e的指数)放大分数,避免负分影响决策:
  2.
  计算这些指数值的总和:
  3.
  再计算每个候选人的支持度占比:
  这样,每个人最终的选择概率就会落在
  到
  之间,并且所有候选人的概率加起来是
  (保证了最终一定会选出一位村长)。
  比喻解释:冰淇淋店的选择
  假设你走进了一家冰淇淋店,店里有四种口味:
  ?
  巧克力(你最爱)
  ?
  香草(你觉得还行)
  ?
  草莓(一般般)
  ?
  抹茶(你不太喜欢)
  如果你只是随意选,你可能会纠结,但Softmax
  规则就像是在你的大脑里装了一个“选择助理”,它根据你对每个口味的喜爱程度(打分),帮你转换成最终的选择概率。例如:
  ?
  你对巧克力的喜爱度是9分,香草7分,草莓5分,抹茶2分。
  ?
  Softmax
  把这些分数转化成指数值,然后归一化成概率:
  结果就是,你有最高的概率选择巧克力,较低的概率选择香草,几乎不会选抹茶。
  总结
  Softmax
  函数的本质是:
  1.
  将原始分数(打分)转换成概率,使得总和为
  1。
  2.
  指数放大优势,让分数高的选项更有可能被选中。
  3.
  让所有选项都有可能被选中(即使得分最低的选项概率也不会完全是0)。
  无论是在选举、推荐系统还是AI分类任务中,Softmax
  都像一个“理性的选择助手”,帮我们做出合理的决策。
  多层分类的中间层会有偏置和中间

第605章 多元分类用softmax函数,用故事解释[1/2页]