强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页

同类热门书

最新上架

  • 会员
    本书参照产业界自动驾驶技术研发的基本流程,充分借鉴了产业界在自动驾驶技术领域中的实际研发经验,以高性能的智能小车和高度仿真的车道沙盘为实验教具和运行环境,深入浅出地讲解自动驾驶技术的原理与实际应用,为初学者打开一扇通往人工智能世界的大门。本书以帮助初学者如何从无到有地打造出具备自动驾驶功能的智能小车为主线,内容分为看车(了解自动驾驶)、造车(设计智能小车)、开车(收集训练数据)、写车(编写自动驾驶
    胡波主编计算机14.9万字
  • 自人工智能(AI)的概念诞生之日起,科学家们就热衷于探讨它的发展路径。第一阶段毫无疑问是计算智能,经过半个多世纪,AI在运算能力和记忆方面早已超越人类。第二阶段,是感知智能,让机器可以看得懂听得懂这个世界。科学界认为,尚未到来的第三阶段,是认知智能,甚至提到一个词:认知时代。我们来到大模型时代或者是生成式人工智能时代了吗?如果我们此时此刻正身处这个时代,那上一个是什么时代?有人说,大规模预训练已经
    刘云浩计算机11.3万字
  • 会员
    2023年以来,OpenAI相继发布了聊天机器人模型ChatGPT、新一代多模态大模型GPT-4等产品,以强大的能力俘获了大量用户,颠覆了用户对于AI的认知。本书以ChatGPT为中心,对ChatGPT的相关知识进行详细的讲解。本书共12章,前5章从ChatGPT概述、技术底座、内容变革、产业格局、商业展望5个方面对ChatGPT进行了解读,帮助用户全面了解ChatGPT,对其形成完整的认知。第6
    施襄计算机12.8万字
  • 会员
    本书强调“把AI作为方法”(AI即ArtifcialIntelligence,人工智能)这一核心理念,旨在引导读者掌握与AI对话的关键技巧,并将AI融入工作和生活真正体验AI带给人类的高效与便捷。本书从技术的发展规律人手,探讨了把AI作为方法的必然性和必要性,进一步剖析了算法与哲学在内在逻辑上的贯通性。此外,本书通过丰富多样的案例展示了AI的强大魅力,通过一系列“召唤术”帮助读者运用AI创造性地
    谭少卿计算机9.7万字
  • 会员
    本书具体包含以下内容:首先,探讨ChatGPT对法律界的冲击,以及律师等从业者的不同反应,进一步分析AI技术对行业的影响和发展趋势。接着,简要介绍ChatGPT的技术原理及应用场景。随后,详细讨论如何将AI力量融入律师职业路径,构建专业律师成长的新飞轮。接下来,分别讨论如何将ChatGPT(GPTs)应用于渠道与案源、检索与研究、案件分析,以及法律文书撰写与合同审核,实现部分日常事务自动化执行。之
    轩珍珍 徐伟浩计算机10.6万字
  • 会员
    《PyTorch深度学习应用实战》以统计学/数学为出发点,介绍深度学习必备的数理基础,讲解PyTorch的主体架构及最新的模块功能,包括常见算法与相关套件的使用方法,例如对象侦测、生成对抗网络、深度伪造、图像中的文字辨识、脸部辨识、BERT/Transformer、聊天机器人、强化学习、自动语音识别、知识图谱等。本书配有大量案例及图表说明,同时以程序设计取代定理证明,缩短学习过程,增加学习乐趣。
    陈昭明 洪锦魁计算机15.2万字
  • 会员
    机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率最大化思想估计模型参数,利用方差对不确定性的捕捉构造k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。
    董平编著计算机18万字
  • 会员
    大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建
    王晓华计算机12.8万字
  • 会员
    量子计算与人工智能的交叉融合,促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式,构建量子人工智能应用。全书共13章,第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式,用量子线路中的相位作为神经网络的可学习参数,重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第
    金贤敏 胡俊杰编著计算机7.6万字

同类书籍最近更新

  • 会员
    本书以人工智能为主题,以其历史发展为主线,结合相关人物、事件和发明创造,深入浅出、生动全面地讲述了人工智能的起源和发展历程,介绍了主要的人工智能理论、技术和应用。本书将人工智能的相关知识与趣闻轶事融为一体,有点有面,通俗易懂。对于对人工智能感兴趣的普通读者来说,这是一本难得的参考读物。
    魏铼人工智能11.5万字
  • 会员
    本书是一本介绍什么是数值模拟技术,以及数值模拟技术如何与工程科学相结合,基于COMSOLMultiphysics解决实际工程问题的书。全书涉及实际工程问题的方方面面,涉及声学、结构力学、流体力学、热量传递、质量运移、电磁场计算、化学反应工程分析等等,是真正的多物理数值仿真的入门指导书。作者希望通过本书,能让读者理解数值仿真技术的真谛,以及这些理论知识应该如何与实际相结合。进一步,或许读者能够领悟
    王刚 安琳编著人工智能8.2万字
  • 会员
    全书共分为11章,除第1章人工智能概述外,其余内容划分为四大部分。第一部分为确定性人工智能的三大基本技术,包括第2,3,4章的知识表示、确定性推理和搜索部分。第二部分包括第5章不确定性人工智能和第6章的智能算法。第三部分为人工智能的重要研究领域,包括第7章的分布式人工智能,第8章的机器学习,第9章的专家系统。第四部分为人工智能应用部分,包括第10章的人工智能设计语言和第11章的人工智能的应用举例。
    党建武等编著人工智能27.5万字
  • 会员
    本书较全面地叙述了智能控制的基本理论、方法和应用。全书共11章。主要内容为:专家控制的基本原理和应用;模糊控制的基本原理和应用;神经网络控制的基本原理和应用;遗传算法及其应用和迭代学习控制方法及其应用。本书系统性强,突出理论联系实际,叙述深入浅出,适合于初学者学习。书中给出了一些智能算法的Matlab仿真程序,并配有一定数量的习题和上机操作题。
    刘金琨编著人工智能12.6万字