X
首页
技术
模拟电子
单片机
半导体
电源管理
嵌入式
传感器
最能打国产芯
应用
汽车电子
工业控制
家用电子
手机便携
安防电子
医疗电子
网络通信
测试测量
物联网
最能打国产芯
大学堂
首页
直播
专题
TI 培训
论坛
汽车电子
国产芯片
电机驱动控制
电源技术
单片机
模拟电子
PCB设计
电子竞赛
DIY/开源
嵌入式系统
医疗电子
颁奖专区
【厂商专区】
【电子技术】
【创意与实践】
【行业应用】
【休息一下】
最能打国产芯
活动中心
直播
发现活动
颁奖区
电子头条
参考设计
下载中心
分类资源
文集
排行榜
电路图
Datasheet
最能打国产芯
嵌入式系统
[分享] #AI挑战营终点站#模型优化--激活函数比较
wakojosin
2024-6-23 17:38
楼主
# 模型介绍 使用的模型是LeNET,模型结构如下: - 输入层:接收32x32的灰度图像; - C1卷积层:使用6个5x5的卷积核进行卷积操作,输出尺寸为28x28; - S2池化层:使用2x2的平均池化操作,输出14x14; - C3卷积层:使用16个5x5卷积核对S2的输出进行卷积,输出尺寸为10x10 - S4池化层:再次使用2x2的平均池化,输出尺寸5x5; - C5卷积层:这是全连接层前的卷积操作,使用120个5x5的卷积核,在之前特征图的基础上进行全连接计算,输出1x1x120的特征向量; - F6全连接层:拥有84个神经元,将C5的输出进一步压缩为一个固定长度的向量,用于分类前的特征表示; - 输出层:最后一个逻辑回归(或层softmax层),用于将F6的输出转化为10类输出的概率分布,对应0~9的数字 ## 模型 ```python # act_func = nn.Softmax() act_func = nn.ReLU() net = torch.nn.Sequential( # Reshape(), nn.Conv2d(1, 6, kernel_size=5, stride=1), act_func, # (32-5)/1+1=28 nn.AvgPool2d(kernel_size=2, stride=2), # (28-2)/2+1=14 nn.Conv2d(6, 16, kernel_size=5), act_func, # 14-5+1=10 nn.AvgPool2d(kernel_size=2, stride=2), # (10-2)/2+1=5 nn.Flatten(), nn.Linear(16 * 5 * 5, 120), act_func, nn.Linear(120, 84), act_func, nn.Linear(84, 10) ) ``` # 优化对比 此次优化对比主要是针对激活函数。 ## 激活函数 1. ReLU 函数f(x)=max(0,x) 特点: - 计算简单,只有线性关系和阈值操作,不会出现梯度饱和 - 对负数输出恒为0,可能会导致部分神经元永远不被激活; 2. Sigmoid 函数f(x)=1/(1+e^(-x)) 特点: - 输出范围有限,介于0~1之间,适用于二分类概率输出场景; - 输出连续可微,适用于逻辑回归等模型; - 当输入绝对值较大时,sigmoid函数的导数值非常接近0(梯度饱和),导致反向传播时梯度消失,会减慢学习过程; - 计算相对复杂,设计指数运算,比ReLU更耗时; 3. Softmax 函数p(i)=e^z(i)/sum(e^z(j)),j=1..n 特点: - 概率输出,将输入转化为概率分布,所有输出之和为1,非常适合多分类任务; - 类别间比较,提供一种自然的方式比较不同类别的相对置信度; - 计算复杂,相比ReLU和Sigmoid,sofsh书倒数tmax涉及到更加复杂的数学计算,包括指数和归一化; - ## 结果对比 激活函数的实际效果: func |Avg.Loss|Accuracy|speed :-: | :-: | :-: |:-: Softmax|0.000047|0.985500|mid sigmoid|0.000058|0.981900|slow ReLU |0.000028|0.990900|quick
本帖最后由 wakojosin 于 2024-6-23 17:40 编辑
点赞
回复评论 (3)
沙发
freebsder
ReLU 前几天看一个说法,改变世界的算式,但是简单的第一天学编程的都能做出来。
默认摸鱼,再摸鱼。2022、9、28
点赞
2024-6-24 14:16
板凳
wangerxian
你这个模型激活函数分析和对比,还是挺有意义的。
点赞
2024-6-24 17:31
4楼
通途科技
好好学习,天天向上,加油每一个人,加油自己,加油!!!
点赞
2024-10-29 21:09
最新活动
是德科技有奖直播 | 应对未来高速算力芯片的设计与测试挑战
免费申请 | 上百份MPS MIE模块,免费试用还有礼!
TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇
Follow me第二季第3期来啦!与得捷一起解锁高性能开发板【EK-RA6M5】超能力!
报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT
30套RV1106 Linux开发板(带摄像头),邀您动手挑战边缘AI~
随便看看
evc4安装问题(急死我了都,麻烦帮帮忙啊)
【儿童陪护机】+ ESP32S3-BOX factory_demo源码下载、编译及刷机过程记录
关于2410的问题!
光伏发电的先导者
有哪位嵌入式系统软件高手愿意到苏州一起创业,公司成立以嵌入式无线模块开发为主。
请问一下,有没有增加P0、P2驱动能力的方法
嵌入式系统的微型JS引擎 Elk
招驱动开发方面的兼职人员
关于视频均衡器,求解几个常识问题,
求助高手帮忙调试dsp_fpga硬件平台
参与HELPER2416开发板助学计划:我和ARM9的初见面
EEWORLD大学堂----UCD3138数字PWM(DPWM)模块
SensorTile在微型飞行器应用的初体验
MX1081和EMW3162对比
生成的PCB板后颜色不是黄色!!!求解
【下载有礼】下载Vishay手册!(即日-08月31日)-MOSFET主题月系列活动
EK_LM3S811学习资料集锦
C8051F的TCPIP源程序
TI申请样片缺货的情况??
framebuffer的问题,好郁闷
电子工程世界版权所有
京B2-20211791
京ICP备10001474号-1
京公网安备 11010802033920号
回复
写回复
收藏
回复