强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    本书共十一章,主要包含四部分:第1章解读ChatGPT的基础原理和提示工程的基本概念;第2至5章介绍提示工程技巧,涵盖有效提示编写、针对复杂任务的提示设计技巧、对话中的提示设计技巧,以及提示的优化与迭代;第6章主要介绍当前ChatGPT推出的进阶功能;第7至11章结合教育领域、市场营销、新媒体运营、软件开发和数据分析实战展示提示工程技巧的应用。
    夏禹计算机12.9万字
  • 会员
    本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7
    张萌 李小武 兰洋 陈中泽等计算机23.8万字
  • 会员
    本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
    朱建明计算机16万字
  • 会员
    本书是一本面向产品经理的实用新书,分12章探讨如何用ChatGPT提升产品管理工作的效率和质量。第1章介绍了人工智能对产品管理的影响;第2章介绍用ChatGPT提高文档写作效率;第3章介绍用ChatGPT进行竞品和市场分析;第4章介绍用ChatGPT优化需求管理;第5章介绍用ChatGPT分析产品数据;第6章介绍用ChatGPT改进用户体验;第7章介绍用ChatGPT设计产品原型;第8章介绍用Ch
    关东升计算机11.5万字
  • 这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术
    (美)布赖恩·希尔布什计算机18.6万字
  • 当前世界正处于百年变局,人类社会已经进入数字经济3.0时代:数字内容迭代,从1.0时代逐步迈入3.0时代;人工智能技术飞跃,从符号推理、深度学习走向知识+数据驱动的3.0时代;产业拓展更深更广,走向智能+3.0时代。随着大模型、ChatGPT、DeepSeek等智能涌现,我们该如何触发AI时代其他的突破性技术涌现?这些技术又该怎样反哺产业升级?本书阐述了人工智能技术演变的大趋势、算力驱动计算体系的
    张亚勤计算机13.1万字
  • 会员
    本书全面探讨人工智能三维仿真竞赛,包括竞赛的立意、类型和流程,并详细介绍人工智能三维仿真软件的核心功能,如编程、控制、循迹、定位等的应用。本书首先介绍人工智能三维仿真竞赛的基础知识,为读者打下坚实的理论基础;其次转向人工智能三维仿真软件的详细教学,通过具体案例强化读者的学习效果;最后总结人工智能三维仿真竞赛中的常见任务类型,并结合历史竞赛案例,为读者提供实际参考。本书适合准备参加人工智能三维仿真竞
    李博 金鑫主编计算机4.4万字
  • 会员
    AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。
    徐英瑾计算机17.8万字
  • 会员
    本书从介绍“ChatGPT第一次接触”开始,分析如何使用该工具来提高开发效率和质量。书中每一章都涵盖了ChatGPT的不同应用场景,从编写各种文档,到辅助进行需求分析和系统设计,以及数据库设计和开发高质量代码等均有讲解。还介绍了如何使用ChatGPT辅助进行系统测试以及任务管理,并对源代码底层逻辑进行了分析。
    关东升计算机8.8万字