windows10安装gym环境后运行atari-py失败,但是atari-py已经安装,运行env=gym.make(‘MsPacman-v0‘)失败

news/2024/7/24 5:26:48

分三步:
第一步:先卸载atari-py。pip uninstall atari-py
第二步:再重新安装这个。pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py
第三步:pip install gym


http://www.niftyadmin.cn/n/957415.html

相关文章

算法学习(九)——MuZero模型

论文: Mastering Atari, Go, chess and shogi by planning with a learned model github复现: https://github.com/werner-duvaud/muzero-general 参考文章: https://blog.csdn.net/jsjytc/article/details/108318156 http://deeprl.ne…

组合API,Ref什么的先放一放

组合API,Ref什么的先放一放

算法学习(十)——强化学习中的奖励设置(不完整)

强化学习中奖励函数的设置非常复杂,这里只是总结一下我的理解。 1.收益信号只能用来传达什么是你想要实现的目标,而不是如何实现現这个目标。所以不应该把奖励设置的过于细致。 2.使用惩罚项可能导致智能体一动不动,因为不动就不会有惩罚。…

强化学习论文研读(一)——Where Do Rewards Come From?

在强化学习领域,传统的要素为环境,观察表述,奖励,动作,这里的奖励完全由环境给出,论文提出一种内部驱动的奖励系统,如下图所示: 本文将奖励分为内部驱动的奖励和外部驱动的奖励&…

这是什么bug

* vuex in ./node_modules/cache-loader/dist/cjs.js??ref--12-0!./node_modules/babel-loader/lib!./node_modules/cache-loader/dist/cjs.js??ref--0-0!./node_modules/vue-loader-v16/dist??ref--0-1!./src/components/HeaderCart.vue?vue&typescript&langjs…

强化学习论文研读(二)——Playing Atari with Deep Reinforcement Learning

DQN系列算法的开山之作,这里的dqn通常称为NIPS-DQN,后来还有nature-DQN,更加好用。 论文的一些理解 Q-Learning的伪代码: NIPS-DQN的伪代码: 有以下几个关键点: 一是图像的处理: 将图像压缩成…

头部文件有一个bug

1、HeaderSearch.vue <template><div class"headerSearch"><input type"search" v-model.trim"keyword"><button click"search">搜索</button></div> </template><script> export d…

torch.gather()通俗理解

torch.gather(input, dim, index, outNone) → Tensor input (Tensor) – 源张量 dim (int) – 索引的轴 index (LongTensor) – 聚合元素的下标 out (Tensor, optional) – 目标张量 >>> t torch.Tensor([[1,2],[3,4]]) 1 2 3 4 >>> torch.gather(t,1,…