路人书

手机浏览器扫描二维码访问

第961章 AI里的白盒黑盒和正则化(第1页)

白盒模型和黑盒模型,就是人工智能的两种算法,白盒顾名思义,可以用人的理解,就是决策树,叶子大于5放左边,叶子小于五放右边,然后继续往下一层,就是无限的分类,可以理解,而黑盒模型就不一样了,是机器学习,多层神经网络,每个层的一定数量神经元全连接,数据反复自己的调参,加权重,也就是什么数据重要,什么不重要,但都要,只是分量不一样,然后还会根据结果是否准确率高再删除一些数据,再进行反向调参,正向叫线性编程,反向就是回归,反正就是倒腾几百万次,数据变来变去,人无法理解,最后出来一个模型,就可以跟现有数据高度吻合

这是一个白盒模型,决策树,可以一层层的分类,容易理解。

正则化(Regularization):原理、方法与应用

在机器学习和深度学习中,过拟合(overfitting)是模型训练的核心挑战之一——模型在训练数据上表现极佳,但在未见过的测试数据上泛化能力差。正则化正是解决这一问题的关键技术,其核心思想是通过在损失函数中引入“惩罚项”,限制模型参数的复杂度,迫使模型学习更简单、更具泛化性的特征,而非死记硬背训练数据中的噪声。

一、正则化的核心目标与本质

1.核心目标

平衡“模型拟合能力”与“泛化能力”:避免模型因过度追求训练误差最小化,而忽略对新数据的适应性。

控制模型复杂度:复杂度过高的模型(如高次多项式、深层神经网络)易学习训练数据中的噪声,正则化通过约束参数规模降低复杂度。

2.本质理解

正则化的本质是**“奥卡姆剃刀原理”在机器学习中的体现**——在多个能拟合数据的模型中,选择“最简单”(参数更简洁、特征更通用)的模型,其泛化能力通常更强。例如:用多项式拟合数据时,一次函数(y=ax+b)比五次函数(y=ax?+bx?+...+e)更简单,若两者在训练数据上误差接近,一次函数对新数据的预测更稳定。

二、经典正则化方法(针对传统机器学习)

传统机器学习(如线性回归、逻辑回归、支持向量机)中,正则化主要通过对模型参数的“范数惩罚”实现,常见有L1、L2正则化,以及两者结合的ElasticNet。

1.L2正则化(岭回归,RidgeRegression)

原理

L2正则化通过在损失函数中加入参数的平方和惩罚项,限制参数的“整体规模”(避免参数值过大)。以线性回归为例:

原始损失函数(均方误差mSE加入L2正则后的损失函数:其中:(正则化强度):控制惩罚力度,时退化为原始模型,越大惩罚越强(参数越接近0):模型的权重参数(不含偏置项,因偏置项仅影响整体偏移,不直接导致过拟合):为了求导后抵消系数,简化计算(非必需,仅影响的数值尺度)。

核心特点

参数“收缩”(Shrinkage)

:L2惩罚会让所有参数向0靠近,但不会将参数直接置为0(参数值整体变小,但保留所有特征)。

抗噪声能力强

:参数值减小后,模型对输入数据的微小波动(噪声)更不敏感,泛化性提升。

适用场景

:特征之间存在相关性、不希望删除任何特征的场景(如医学特征,每个指标都可能有意义)。

2.L1正则化(套索回归,LassoRegression)

原理

L1正则化通过在损失函数中加入参数的绝对值和惩罚项,实现“参数稀疏化”(即强制部分参数变为0,相当于删除冗余特征)。以线性回归为例,加入L1正则后的损失函数:核心特点

参数稀疏化

:L1的绝对值惩罚会导致部分参数被“压缩”到0,从而自动完成“特征选择”(删除对模型贡献极小的特征)。例:用Lasso处理“房价预测”数据时,若“小区绿化率”的参数被置为0,说明该特征对房价影响可忽略,模型训练时无需考虑。

计算挑战:绝对值函数在处不可导,传统梯度下降无法直接使用,需用“次梯度下降”“坐标下降”等特殊优化方法。

适用场景

:特征维度高、存在大量冗余特征的场景(如文本分类中的词袋模型,特征数可能达数万,需筛选核心词汇)。

3.L1与L2的对比:为什么L1能稀疏化?

L1和L2的核心差异源于惩罚项的“几何形状”,可通过“约束域”直观理解:假设模型仅含两个参数和,正则化等价于在“参数空间”中加入一个约束域,损失函数的最优解需落在“约束域与损失函数等高线的切点”上:

L2的约束域是圆形:切点通常不在坐标轴上,因此参数不会为0;

L1的约束域是正方形:正方形的顶点在坐标轴上(如,切点更易落在顶点,导致某一参数为0。

对比维度

L1正则化(Lasso)

L2正则化(Ridge)

惩罚项形式(绝对值和)(平方和)参数效果部分参数置为0(稀疏化特征选择)

所有参数缩小,不置为0

请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。

热门小说推荐
(埃及同人)[埃及同人]媚祸传奇+番外

(埃及同人)[埃及同人]媚祸传奇+番外

书名埃及同人媚祸传奇作者童归宁阿肯娜媚被吊在屋顶晒了三天日光浴,她觉得自己就像个被烤焦的面包,内里的鹰嘴豆馅儿已经腐败,王妃的末路还不如尼罗河边的枯草。阿肯娜媚临死前才明白,要想好好活下去,你不能只是个寡妇还是个运气很差的寡妇。赛那沙我的女王!请相信我会把我的面包都给你!脖子以下不能描写的部分也都给你!喂,和亲神马...

我的美女上司

我的美女上司

嘀嘀嘀,这才乖啊,以后走路的时候记得小心点,不要再被别人欺负了。金飞一脸邪恶笑嘻嘻的拍拍女人脸蛋,转身走出人群,没事人一样在路边小摊买了点早餐,钻进破夏利,一路唏哩哗啦乱响的冲进了马路里面。...

穿书之好运满满

穿书之好运满满

本书原名穿书之好孕满满一朝穿越,元满无奈发现自己穿越到了一本玛丽苏言情文中,成为了一个连炮灰都算不上的路人甲伪表妹,原本元满打算既来之则安之,可是老天却给了她一个巨大的金手指,那就是能!生!—扯着自家将军的衣袖,元满崩溃大哭嘤嘤嘤将军我们能别生了吗?盛澹不能!元满拍了拍自己西瓜般圆滚滚的肚子,眼泪汪汪道这已经是第七个娃了啊!盛澹穿越千年,她的宿命就是遇见他1个新手司机上路史本文傻白甜!本文傻白甜!本文傻白甜!作者菌的智商不在线!所以里面的角色智商都不在线!慎入!!!架空勿考据!和编编商议过了,本文8月19号也就是星期五入V,届时有三更掉落!!!谢绝任何形式的转载!...

总裁大人,宠入骨!

总裁大人,宠入骨!

混蛋,你走开!宝贝儿,你嫁给我了,乖乖的,嗯?  惨死重生的洛蔷薇,本以为这一世能摆脱倒追了十八年的老公墨时澈,过上潇洒的生活,可她老公不知着了什么魔,突然化身宠妻狂魔缠着她,动不动就撩她抱她欺压她!宠她宠的令人发指!  最后她被宠的受不了了,甩下离婚协议就跑,却被男人抓住,在千万人瞩目的镜头面前,他对着她单膝跪地离婚可以,但你现在必须答应我的求婚重新嫁给我,因为你是我此生唯一的墨太太。  她又羞又恼谁让你在这求婚的!  男人宠溺的低笑那好,我们现在回家,关上房门,边喝交杯酒边求婚,嗯?男女主身心干净,1v1...

总裁的第七个新娘:买来的妻子

总裁的第七个新娘:买来的妻子

他受过严重的心理创伤,情感麻木,对女人只有厌恶没有爱慕。她优雅聪慧,为了不重蹈他前妻的覆辙,婚后生活,步步为营。面对他的无视疏离,她从不曾退缩放弃,坚信爱是化解恨最好的方式。当冷酷外衣终被她层层拨开,他却残忍的发现,自己不过是她复仇的工具。爱已随风飘,情已被海葬,是谁在耳边说,心是可以收回的...

晕开之诗

晕开之诗

由原创古体诗展开的一个个充满想象的故事,让你读后有更好的心情,激发想象力和创造力,获得心灵疗愈和身心健康。...

每日热搜小说推荐