
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
同类热门书
最新上架
智能体时代
《智能体时代》作为一部融合生物智能演化机制与人工智能技术突破的科普作品,通过对从单一神经元到复杂智能体系统的跨学科分析,不仅揭示了智能涌现的本质规律,还为读者构建了一个从微观到宏观的智能进化全景图。这部横跨生物学、计算机科学和认知科学等多个领域的作品,以其独特的“智能体视角”,系统性地阐释了从Claude和GeminiUltra等大语言模型,到AutoGPT和MicrosoftAutoGen等计算机21.2万字- 会员
生成式人工智能(基于PyTorch实现)
本书通过从零开始构建生成式人工智能模型来探讨生成式人工智能的底层机制,并使用PyTorch对生成式人工智能模型进行编程的实践指导,以期让读者在了解生成对抗网络(GAN)、变分自编码器(VAE)、循环神经网络(RNN)、Transformer、扩散模型、大语言模型(LLM)和LangChain等技术原理之后,能构建可生成形状、数字、图像、文本和音乐的生成式人工智能模型。本书适合各种商业领域中的人工智计算机22万字 - 会员
AIGC+智慧教育:Web 3.0时代的教育变革与转型
随着Web3.0时代的来临,我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深,AI驱动的教育新形态、新模式、新产品不断涌现,数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势,全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技计算机13.8万字 - 会员
AI爆款文案:巧用AI大模型让文案变现插上翅膀
本书通过对10款人工智能应用的介绍及调试,帮助读者快速掌握人工智能辅助文案变现的方式。本书共10章,分别讲解AI智能创作,AI爆款文案写作工具,人工智能辅助泛流量文案、泛商业文案、私域文案创作,利用人工智能实现文案变现的底层逻辑,以及在今日头条、百家号、小红书、知乎等平台及不同展示形式下进行文案创作的实战案例等。计算机12.2万字 - 会员
社交网络信息传播模型、算法及应用
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。计算机16万字 - 会员
成为GPT高手
优化提示词是用好GPT的关键。本书基于GPT,讨论提示词的使用技巧和优化方法。本书不仅讨论如何让GPT不再“胡说八道”,如何用GPT解决各种问题,如何让GPT了解用户的需求,如何让GPT记忆力超群,还讲述如何应用GPT,如何让GPT自动运行,如何打造商业级别的GPT,如何辨别GPT生成的内容。无论你是职场人士,还是在校大学生,通过阅读本书,都可以掌握用好GPT的关键,提升自己的工作或学习效率。计算机8.5万字 - 会员
AI训练师手册:算法与模型训练从入门到精通
本书共有10章,包括51个实操案例解析和80个行业案例分析。书中内容从技能线和案例线展开介绍。技能线:从人工智能的相关技术入手,不仅介绍了AI训练师的发展历程和行业动态,还重点讲述了AI训练师的职业技能提升方法。案例线:不仅涵盖了AI领域的各个方面,而且非常注重算法与模型的实际应用,通过分析大量的经典案例,可以让读者更好地掌握AI训练的相关技能。计算机11.6万字 - 会员
新时代体育服务业与人工智能融合研究
本书综合运用定性研究和定量研究方法,对体育服务业与人工智能的融合进行深入研究。本书首先是运用耦合协调模型和灰色关联分析法对目前我国体育服务业与人工智能融合的现状进行定量研究,探索二者之间目前处于什么融合发展阶段;其次,对体育服务业与人工智能的融合机理进行了研究,在此基础上,以体育服务业的4个细分行业为例,进行了体育服务业与人工智能融合的具体研究;接着,运用模糊AHP-TOPSIS研究方法对体育服务计算机15万字 - 会员
人工智能治理研究
本书从技术和规制两个角度入手,以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路,在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上,对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。计算机23.9万字