资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!

简介:

入坑深度学习的同学肯定都听过台湾大学的李宏毅教授,或者是他那本非常受欢迎的课程——《1天搞懂深度学习》。这门课程的讲义PPT总共有286页,深入浅出的介绍了深度学习的概念、框架及展望。

课程内容通俗易懂,适合深度学习初学者及相关从业人员,在大数据文摘后台回复“深度学习”可下载课程讲义。

文摘菌今天要给大家推荐的是李老师最近更新的课程:深度强化学习(deep reinforcement learning),目前这门课程在youtobe上更新了4个视频,分别是策略梯度算法(Policy Gradient)、近端策略优化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高级技巧。

523afe2536363e97a4ecdf82b46a123042cde17c

每个视频大约40分钟左右,PPT内容为英文,讲授语言为中文。课程内容主打强化学习,涉及理论和论文解读,需要一定的强化学习的基础,感兴趣的小伙伴可以学起来啦!

深度强化学习youtube链接:

https://www.youtube.com/watch?v=z95ZYgPgXOY

深度强化学习B站链接:

http://www.bilibili.com/video/av24724071

文摘菌对视频内容做了简单介绍,供大家参考。

策略梯度算法:

  • 策略梯度算法理论

  • 算法实现

  • 实用建议

近端策略优化:

  • 采样问题

  • PPO算法理论

  • 对论文结果的解读

Q-learning算法基本概念:

  • 蒙特卡洛方法

  • Actor-Critic算法

  • Q-learning理论

Q-learning算法高级技巧:

  • Double DQN

  • Dueling DQN

  • 高级技巧

目前课程在连载状态,感兴趣的同学可以关注李宏毅的youtube主页:

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos

此外,李老师在youtube还有《机器学习》和《深度学习》两门课程的视频讲解,这两门课程也获得了不错的口碑,课程链接如下:

机器学习youtube链接:

https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

机器学习B站链接:

http://www.bilibili.com/video/av19144978

深度学习youtube链接:

https://www.youtube.com/watch?v=KKT2VkTdFyc

深度学习B站链接:

http://www.bilibili.com/video/av20961661

李宏毅老师简介:主要研究领域为机器学习(特别是深度学习)、口语语义理解和语音识别。

  • 2012年从台北 National Taiwan University (NTU) 博士毕业。

  • 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士后。

  • 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做访问学者。

  • 现任 Department of Electrical Engineering of National TaiwanUniversity 副教授。


原文发布时间为:2018-06-13
本文作者:文摘菌
本文来自云栖社区合作伙伴“ 大数据文摘”,了解相关信息可以关注“ 大数据文摘”。
相关文章
|
IDE Linux 开发工具
Linux 实操篇-Linux 磁盘分区、挂载
Linux 实操篇-Linux 磁盘分区、挂载
596 0
|
数据采集 消息中间件 监控
数据库 ER 图介绍|学习笔记
快速学习数据库 ER 图介绍
数据库 ER 图介绍|学习笔记
|
前端开发 Java 测试技术
基于Spring boot的图书馆图书借阅管理系统的设计与实现
基于Spring boot的图书馆图书借阅管理系统的设计与实现
3989 0
|
8月前
|
缓存 JavaScript 前端开发
《凭什么撼动Node.js?Bun和Zig性能优势深度揭秘》
Node.js长期主导服务器端运行时,但新兴的Bun和Zig正带来新挑战。Bun是一款高性能JavaScript运行时,基于Zig语言开发,启动速度快4倍于Node.js,依赖管理效率提升25倍。它集成了打包、转译、测试等功能,简化开发流程。Zig则以精细的内存管理和跨平台能力助力Bun性能飞跃,同时在服务端渲染、命令行工具开发等场景中表现出色。尽管Node.js生态成熟,Bun和Zig正逐步改写JavaScript运行时格局,推动技术进步。
438 15
|
关系型数据库 MySQL 数据安全/隐私保护
允许远程链接mysql,开放3306端口
允许远程链接mysql,开放3306端口
允许远程链接mysql,开放3306端口
|
4月前
|
Ubuntu 安全 Linux
Ubuntu 22.04.5 LTS发布,新硬件支持成亮点
用户可根据个人需求选择相应的版本进行下载,并遵循安装指南进行全新安装或通过USB设备创建启动盘进行系统部署。对于在服务器或企业环境中部署Ubuntu的用户,建议选用Ubuntu 22.04.5 LTS Server版本,它专为服务器优化并配备了强大的网络与安全工具。
|
11月前
|
机器学习/深度学习 存储 人工智能
【科普向】我们所说的AI模型训练到底在训练什么?
人工智能(AI)模型训练类似于厨师通过反复实践来掌握烹饪技巧。它通过大量数据输入,自动优化内部参数(如神经网络中的权重和偏置),以最小化预测误差或损失函数,使模型在面对新数据时更加准确。训练过程包括前向传播、计算损失、反向传播和更新权重等步骤,最终生成权重文件保存模型参数,用于后续的应用和部署。理解生物神经网络的工作原理为人工神经网络的设计提供了灵感,后者广泛应用于图像识别、自然语言处理等领域。
|
JavaScript 前端开发 数据安全/隐私保护
vue element plus Form 表单
vue element plus Form 表单
751 0
|
JavaScript Java 云计算
后端开发的演变与未来趋势
在数字化时代的浪潮中,后端开发扮演着至关重要的角色。本文将探讨后端技术的历史演变、当前主流技术和框架、以及面临的挑战和未来的发展趋势。通过深入浅出的方式,为读者揭示后端开发的奥秘,并启发对未来技术的思考。
|
边缘计算 计算机视觉 异构计算
【YOLOv8改进 - 特征融合NECK】Slim-neck:目标检测新范式,既轻量又涨点
YOLO目标检测专栏探讨了模型优化,提出GSConv和Slim-Neck设计,以实现轻量级模型的高效检测。GSConv减小计算复杂度,保持准确性,适合实时任务。Slim-Neck结合GSConv优化架构,提高计算成本效益。在Tesla T4上,改进后的检测器以100FPS处理SODA10M数据集,mAP0.5达70.9%。论文和代码可在提供的链接中获取。文章还介绍了YOLOv8中GSConv的实现细节。更多配置信息见相关链接。