[活动] 《深度强化学习实战》收到书并读了第一章

ddllxxrr 2023-10-21 21:18 楼主

很高兴收到书啊，上照片：

未来的计算机语言将更关注目标，而不太关注同程序员指定的过程。

————————马文.明斯基

这句话我很反感，因为我从事的工作就是程序员指定的过程。不指定过程要单片机程序员干么？

深度强化学习：是机器学习的一个子领域，它将深度学习（神经网络）应用于强化学习任务。

强化学习：是表示和解决控制任务的通用框架，在该框架中，我们可以自由选择应用于特定控制任务的算法。

它们俩之间的关系：书中说得明白：深度学习是机器学习的一个子领域，可以为强化学习解决控制任务提供支持。

试错策略通常属于蒙特卡洛法的范畴。蒙特卡洛法本质上是对环境进行随机抽样。

强化学习（或控制任务）和普通的监督学习之间的一个关键区别是：在控制任务中，强化学习算法需要做出决策和采取动作，这些动作会影响将来发生的事情。在强人学习框架中，采取动作是一个关键词，它的含义或多或少是你所期望的。不过，所采取的每个动作都是分析当前环境状态和尝试基于该信息做出最佳决策的结果。

强化学习框架的最后一个概念是，采取每个动作后，算法会得到一个奖励（reward）.奖励是局部信号，用于表示学习算法在实现总体目标方面的表现如何。虽然我们将其管为“奖励”但它可以是正向信号（做得好，继续保持），也可以负向信号（不要那样做）。

最后，我们为该算法取个好听的名字，称之为智能体（agent）.

因为这是一本关于深度强化学习的书，所以我们会用深度学产算法（也称为深度神经网络）来实现智能体。

可见这本书还是讲神经网络的。

http://shop34182318.taobao.com/ https://shop436095304.taobao.com/?spm=a230r.7195193.1997079397.37.69fe60dfT705yr

回复评论（4）

沙发 freebsder

环境要求高不？比如4090啥的

默认摸鱼，再摸鱼。2022、9、28

点赞 2023-10-23 17:38

板凳 ddllxxrr

引用: freebsder 发表于 2023-10-23 17:38 环境要求高不？比如4090啥的

不高，Python

http://shop34182318.taobao.com/ https://shop436095304.taobao.com/?spm=a230r.7195193.1997079397.37.69fe60dfT705yr

点赞 2023-10-24 16:22

4楼 chejm

是新出版的书吗？

点赞 2023-11-6 06:34

5楼 ddllxxrr

引用: chejm 发表于 2023-11-6 06:34 是新出版的书吗？

2023年4月第一版

2023年4月第一次印刷

http://shop34182318.taobao.com/ https://shop436095304.taobao.com/?spm=a230r.7195193.1997079397.37.69fe60dfT705yr

点赞 2023-11-6 20:49

最新活动

2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

有奖直播报名中！抢占工业4.1先机文晔科技日等你来！

罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！

是德科技有奖直播 | 应对未来高速算力芯片的设计与测试挑战

随便看看

【树莓派4B测评】树莓派4引脚功能以及操作方法

疯抢了！新版ARM Cortex-M0 LPC1114学习手册

请教：zigbee实现低功耗，我看网上的教材都是将PWRMGR_ALWAYS_ON 用PWRMGR_BATTERY...

STM32的ADC与DMA的问题讨论

征求参加嵌入式培训意见

直播：借助 Microchip 生态系统中的 PIC® 和 AVR® 单片机开启嵌入式到云端之旅第二场

炼狱传奇-RAM之战

【CY8CKIT-149 PSoC 4100S测评】+熟悉开发环境

Proteus仿真出错

HP大中华区总裁孙振耀退休感言(有点长，慢慢看)

wince 5.0 binfs如何加载？

TA 输入时钟源

关于更改RTSC工程的platform，不知是否方法错了，各位帮帮忙看下，谢啦

AT28C64 如何写程序控制

混合动力技术的历史

京公网安备 11010802033920号

写回复

[活动] 《深度强化学习实战》收到书并读了第一章

回复评论 （4）

沙发 freebsder

板凳 ddllxxrr

4楼 chejm

5楼 ddllxxrr

回复评论（4）