Flask:一个轻量级的 Web 应用框架,可以用于构建小型应用程序、RESTful API 或大型的 Web 应用程序。
Django:一个高效、功能强大的 Web 应用程序框架,支持快速开发和可重用的组件。
Scrapy:一个用于爬取网页的框架,可以轻松地提取数据、图像、文本和其他类型的内容。
Pygame:一个用于制作 2D 游戏的框架,支持多种音频、视频和输入设备。
Keras:一个高级的
五. Deep Q-network(DQN)
现实中强化学习面临的状态空间往往是连续的,存在无穷多个状态。这种情况下,就不能再使用表格对价值函数进行存储,采用价值函数近似(Value Function Approximation)的方式进行逼近
在连续的状态和动作空间中,可以用函数来表示近似计算:
其中函数通常是一个参数为的函数,比如神经网络
5.1 状态价值函数(State Value F