Gym 發行說明

0.26.2

於 2022-10-04 發布 - GitHub - PyPI

發行說明

這是另一個非常小的錯誤修復版本。

錯誤修復

  • 由於 reset 現在返回 (obs, info),在向量環境中,這會導致最終 step 的 info 被覆寫。現在,最終的觀察和 info 包含在 info 中,作為 "final_observation" 和 "final_info" @pseudo-rnd-thoughts
  • 當嘗試在未指定 render_mode 的情況下進行渲染時,新增警告 @younik
  • 更新 Atari Preprocessing,使 wrapper 可以被 pickled @vermouth1992
  • Github CI 已加強,使 CI 僅具有讀取權限 @sashashura
  • 釐清並修正 GraphInstance 中的錯字 @ekalosak

0.26.1

於 2022-09-16 發布 - GitHub - PyPI

發行說明

這是 0.26.0 的一個非常小的錯誤修復版本

錯誤修復

  • #3072 - 之前,即使僅使用 mujoco-pymujoco 也是必要的模組。此問題已修正,現在僅需安裝和使用 mujoco-py 即可。@YouJiacheng
  • #3076 - 如果未指定 env.render_modePixelObservationWrapper 會引發例外。@vmoens
  • #3080 - 修正 CarRacing 中車輪顏色不正確的錯誤 @foxik
  • #3083 - 修正 BipedalWalker,如果智能體向後移動,渲染的陣列大小會不同。@younik

拼寫

  • 修正 readme API 範例中的截斷錯字 @rdnfn
  • 將 pendulum 觀察空間從 angle 更新為 theta,使其更一致 @ikamensh

0.26.0

於 2022-09-06 發布 - GitHub - PyPI

v0.26.0 的發行說明

此版本旨在成為核心 API 主要 API 變更的最後一個版本。先前所有「關閉」的基礎 API 變更(step 終止/截斷、reset info、無 seed 函數、由初始化決定的渲染模式)現在預設為啟用。我們仍然計劃對 Gym 本身進行破壞性變更,但僅限於非常容易升級的事物(環境和 wrappers)以及不常用的事物(向量 API)。一旦這些方面穩定下來,我們將發布適當的 1.0 版本並遵循語義版本控制。此外,除非此版本發生嚴重錯誤,我們必須發布修補程式版本,否則這將是 Gym 在一段時間內的最後一個版本。

如果您一直在等待 Gym 的「穩定」版本來升級您的專案,考慮到所有正在進行的變更,這就是您要的版本。

我們也想說,我們非常感謝社群在我們接管 Gym 的維護並對核心 API 進行所有這些重大變更的過程中,對我們的耐心。我們感謝您的耐心和支持,但希望從現在開始的所有變更都將變得更加微小。

破壞向後相容性

這些變更適用於所有 gym 的內部 wrappers 和環境,但對於未更新的環境,我們提供了 EnvCompatibility wrapper,供使用者將舊的 gym v21 / 22 環境轉換為新的核心 API。此 wrapper 可以透過 apply_api_compatibility 參數輕鬆地在 gym.makegym.register 中應用。

  • Step 終止/截斷 - Env.step 函數傳回 5 個值,而不是之前的 4 個 (observations, reward, termination, truncation, info)。即將發布一篇包含更多詳細資訊的部落格文章,以解釋此決策。@arjun-kg
  • Reset info - Env.reset 函數傳回兩個值 (obsinfo),且 gym wrappers 和環境沒有 return_info 參數。這對於某些為每個動作提供動作遮罩資訊的環境非常重要,而重置時不可能提供。@balisujohn
  • Seed 函數 - 雖然 Env.seed 是一個有用的函數,但它幾乎僅用於 episode 的開始,並已新增至 gym.reset(seed=...)。此外,對於一些使用外部隨機數字產生器的環境(例如 Atari),除了 reset 之外,無法在任何時間設定 seed。因此,seed 不再預期在 gym 環境中起作用,並已從所有 gym 環境中移除 @balisujohn
  • 渲染 - 只使用單一渲染模式是正常的,為了協助開啟和關閉渲染視窗,我們已將 Env.render 變更為不接受任何引數,因此所有渲染引數都可以成為環境建構子的一部分,即 gym.make("CartPole-v1", render_mode="human")。有關新 API 的更多詳細資訊,請參閱 部落格文章 @younik

主要變更

  • 渲染模式 - 在 v25 中,渲染模式的含義發生了變化,即 "rgb_array" 返回渲染幀列表,而 "single_rgb_array" 返回單個幀。在此版本中已還原,"rgb_array" 的含義與之前相同,返回單個幀,而新的模式 "rgb_array_list" 返回 RGB 陣列列表。透過在 gym.make 期間應用的 wrapper 實現返回渲染觀察列表的功能。#3040 @pseudo-rnd-thoughts @younik
  • 新增 save_video,它使用 moviepy 渲染 RGB 幀列表,並更新 RecordVideo 以使用此函數。這移除了對錄製 ansi 輸出的支援。#3016 @younik
  • RandomNumberGenerator 函數:randrandnrandintget_stateset_statehash_seedcreate_seed_bigint_from_bytes_int_list_from_bigint 已移除。@balisujohn
  • ale-py 提升至 0.8.0,它與新的核心 API 相容
  • 新增 EnvAPICompatibility wrapper @RedTachyon

次要變更

0.25.2

於 2022-08-18 發布 - GitHub - PyPI

v0.25.2 的發行說明

這是一個相當小的錯誤修復版本。

錯誤修復

  • 移除 step 相容性函數中對 info 內 _TimeLimit.truncated 的要求。這使 step 與 Envpool 相容 @arjun-kg
  • 由於在展平 spaces 時 Dict spaces 的順序很重要,因此更新了 __eq__ 以考慮 .keys() 的順序。@XuehaiPan
  • 允許 pickled CarRacing 環境。更新所有 gym 環境以正確地 pickled。@RedTachyon
  • 使用整數 seeding DictTuple spaces 可能會導致規格較低的電腦因需要 8Gb 記憶體而掛起。更新了使用整數的 seeding,使其不需要唯一子 seed(子 seed 碰撞很少見)。對於需要所有子空間唯一子 seed 的使用者,我們建議使用包含子 seed 的字典或元組。@olipinski
  • 修正新渲染 api 的 metaclass 實作,以允許自訂環境也使用 metaclasses。@YouJiacheng

更新

  • 簡化 step 相容性函數,使其更易於偵錯。使用舊 step API 的時間限制 wrapper 如果 terminated 和 truncated 皆為 true,則傾向於 terminated。這是因為舊的 done step API 只能編碼 3 個狀態(無法編碼 terminated=Truetruncated=True),因此我們必須僅編碼為 terminated=Truetruncated=True@pseudo-rnd-thoughts
  • 新增 Swig 作為依賴項 @kir0ul
  • render_modemetadata 新增類型註釋 @bkrl

0.25.1

於 2022-07-26 發布 - GitHub - PyPI

發行說明

  • 為 CliffWalking 環境新增渲染 @younik
  • 由於難以同時支援新舊 API,PixelObservationWrapper 僅支援新的渲染 API。如果使用者正在使用舊的 API,則會發出警告 @vmoens

錯誤修復

  • 還原 wrapper.FrameStack 上的不正確版本 @ZhiqingXiao
  • 修正 mountain car 的重置邊界 @psc-g
  • 移除導致錯誤無法被捕獲的跳過測試 @pseudo-rnd-thoughts
  • 為沒有 metadata 的環境新增向後相容性 @pseudo-rnd-thoughts
  • 修正 BipedalWalker 對於 RGB 陣列的渲染 @1b15
  • 修正 PixelObsWrapper 使用新渲染的錯誤 @younik

錯字

  • 重新措辭 Lunar Lander 環境中 observation 的定義 @EvanMath
  • gym/spaces/dict.py 中的頂部 docstring @Ice1187
  • humanoidstandup_v4.pymujoco_env.pyvector_list_info.py 中的多個錯字 @timgates42
  • 被動環境檢查器中的錯字 @pseudo-rnd-thoughts
  • Swimmer 旋轉中的錯字 @lin826

0.25.0

於 2022-07-13 發布 - GitHub - PyPI

發行說明

此版本最終引入了過去一年或更長時間以來計劃的所有新 API 變更,所有這些變更都將在後續版本中預設為開啟。在此之後,Gym 的開發應該會變得非常順利。此版本還修復了 0.24.0 和 0.24.1 中存在的大型錯誤,我們強烈建議不要使用這些版本。

API 變更

  • Step - 大多數深度強化學習演算法實作都是不正確的,因為理論和實務之間存在重要差異,即 done 不等於 termination。因此,我們修改了 step 函數以返回五個值:obs, reward, termination, truncation, info。這些變更的完整理論和實務原因(以及範例程式碼變更)將在即將發布的部落格文章中說明。此變更旨在向後相容(目前),如有問題,請在 github 或 discord 上回報問題。@arjun-kg
  • Render - 渲染 API 已變更,模式必須在 gym.make 期間使用關鍵字 render_mode 指定,之後渲染模式將固定。有關更多詳細資訊,請參閱 https://younis.dev/blog/2022/render-api/#2671。這具有額外的變更
    • 使用 render_mode="human",您不需要呼叫 .render(),渲染將在 env.step() 上自動發生
    • 使用 render_mode="rgb_array".render() 會彈出自上次 .reset() 以來渲染的幀列表
    • 使用 render_mode="single_rgb_array".render() 會像以前一樣返回單個幀。
  • Space.sample(mask=...) 允許在取樣動作時使用遮罩,以啟用/停用隨機取樣的特定動作。我們建議開發人員將其新增至 reset(return_info=True)step 返回的 info 參數中。請參閱 #2906,以取得遮罩或個別 spaces 的範例實作。我們已在 taxi 環境中新增此功能的範例版本。@pseudo-rnd-thoughts
  • 為使用圖形樣式觀察或動作 spaces 的環境新增 Graph。目前,節點和邊緣 spaces 只能是 BoxDiscrete spaces。@jjshoots
  • 為涉及智能體之間通訊且具有動態長度訊息的強化學習新增 Text space(否則可以使用 MultiDiscrete)。@ryanrudes @pseudo-rnd-thoughts

錯誤修復

  • 修正 car racing 終止,如果智能體完成最後一圈,則環境會透過截斷而不是終止結束。這為 Car racing 新增了版本升級至 v2,並移除了 Car racing discrete,改為使用 gym.make("CarRacing-v2", continuous=False) @araffin
  • v0.24.0 中,opencv-python 意外地成為專案的必要條件。此問題已還原。@KexianShen @pseudo-rnd-thoughts
  • 更新 utils.play,以便如果環境指定 keys_to_action,該函數將自動使用該資料。@Markus28
  • 在渲染 blackjack 環境時,修正了渲染會變更莊家頂牌的錯誤。@balisujohn
  • 更新 mujoco docstring 以反映意外被覆寫的變更。@Markus28

其他

  • 整個專案都使用 pyright 進行部分類型提示(專案檔案中沒有任何檔案被類型提示器忽略)。@RedTachyon @pseudo-rnd-thoughts(未來的工作將為核心 API 新增嚴格的類型提示)
  • 動作遮罩已新增至 taxi 環境(由於向後相容性,因此沒有版本升級)@pseudo-rnd-thoughts
  • Box space 形狀推斷允許將 highlow 純量自動設定為 (1,) 形狀。識別純量的次要變更。@pseudo-rnd-thoughts
  • 在經典控制環境中新增選項支援,以修改環境初始隨機狀態的邊界 @psc-g
  • RecordVideo wrapper 即將被棄用,新的渲染 API 不支援 TextEncoder。計劃將 RecordVideo 替換為單個函數,該函數將接收來自環境的幀列表,並使用 MoviePy 自動將其渲染為影片。@johnMinelli
  • gym py.Dockerfile 透過多項最佳化,從 2Gb 優化至 1.5Gb @TheDen

0.24.1

於 2022-06-07 發布 - GitHub - PyPI

這是 0.24.0 版本的錯誤修復版本

錯誤修復

  • 取代 V24 中引入的環境檢查器,使環境檢查器不會在 make 期間呼叫 stepreset。此新版本是一個 wrapper,它將觀察 stepreset 在首次呼叫時返回的資料,並根據環境檢查器檢查資料。@pseudo-rnd-thoughts
  • 修正 MuJoCo v4 引數金鑰回呼、關閉渲染器中的環境以及 mujoco_rendering close 方法。@rodrigodelazcano
  • 移除註冊中的冗餘警告 @RedTachyon
  • 從 MuJoCo xml 檔案中移除數學運算 @quagla
  • 新增對 unpickling legacy spaces.Box 的支援 @pseudo-rnd-thoughts
  • 修正 mujoco 環境動作和觀察 space docstring 表格 @pseudo-rnd-thoughts
  • 停用 wrappers 存取 _np_random 屬性,且 np_random 現在會轉發到環境 @pseudo-rnd-thoughts
  • 重寫 setup.py 以新增「testing」meta 依賴群組 @pseudo-rnd-thoughts
  • 修正了 rescale_action wrapper 中的文件字串 (docstring) @gianlucadecola

0.24.0

於 2022-05-25 發布 - GitHub - PyPI

主要變更

  • 新增了 v4 mujoco 環境,其使用新的 deepmind mujoco 2.2.0 模組。
    這可以透過 pip install gym[mujoco] 安裝,而舊的綁定仍然
    可透過 v3 環境和 pip install gym[mujoco-py] 取得。
    這些新的 v4 環境應具有與 v3 相同的訓練曲線。對於 Ant 環境,我們發現有一個
    接觸參數在 v3 中未應用,但在 v4 中可以啟用,然而發現這會產生顯著
    更差的效能,請參閱評論 以了解更多詳情。@rodrigodelazcano
  • 向量環境 step info API 已變更,以便未來能支援硬體加速。
    請參閱 此 PR 以了解修改後的 info 風格,現在使用字典而非環境資訊列表。
    如果您仍然希望使用列表 info 風格,請使用 VectorListInfo wrapper。@gianlucadecola
  • gym.make 上,會執行 gym env_checker,其中包含呼叫環境的 resetstep 以檢查
    環境是否符合 gym API。若要停用此功能,請執行 gym.make(..., disable_env_checker=True)@RedTachyon
  • 重新加入了 gym.make("MODULE:ENV") 匯入風格,該風格在 v0.22 中意外移除 @arjun-kg
  • Env.render 現在強制執行順序,使得在呼叫 Env.render 之前,必須先呼叫 Env.reset。如果這是必要
    的功能,請將 OrderEnforcer wrapper 的 disable_render_order_enforcing 設定為 True@pseudo-rnd-thoughts
  • 在 Lunar Lander 環境中新增了風和亂流,預設情況下是關閉的,
    請使用 wind_powerturbulence 參數。@virgilt
  • 改進了 play 函數,允許傳遞多個鍵盤字母,而不是 ascii 值 @Markus28
  • 為大多數儲存庫新增了 google 風格的 pydoc 字串 @pseudo-rnd-thoughts @Markus28
  • 透過 gym.make("CarRacing-v1", continuous=False) 新增了離散的賽車環境版本
  • Pygame 現在是 box2d 和經典控制環境的可選模組,僅在渲染時是必要的。
    因此,請使用 pip install gym[box2d]pip install gym[classic_control] 安裝 pygame @gianlucadecola @RedTachyon
  • 修正了批次空間 (在 VectorEnv 中使用) 中的錯誤,原始空間的 seed 會被忽略 @pseudo-rnd-thoughts
  • 新增了 AutoResetWrapper,當 Env.step 完成 (done) 為 True 時,會自動呼叫 Env.reset @balisujohn

次要變更

  • BipedalWalker 和 LunarLander 的觀察空間具有非無限的上限和下限。@jjshoots
  • 將 ALE-py 版本升級至 0.7.5
  • 透過不渲染螢幕外的多邊形,改善了賽車的效能 @andrewtanJS
  • 修正了賽車中方向指示燈為黑色而非紅色/白色的問題 @jjshoots
  • VecEnvWrapper 的錯誤修正,將方法呼叫轉發到環境 @arjun-kg
  • 移除了 Box2d 上不必要的 try except,因此如果 Box2d 未正確安裝,則會顯示更有幫助的錯誤訊息 @pseudo-rnd-thoughts
  • 簡化了 gym.registry 後端 @RedTachyon
  • 透過 python 3.7+ 模組的回溯移植,重新加入了 python 3.6 支援。這未經測試,且與 mujoco 環境不相容。@pseudo-rnd-thoughts

0.23.1

於 2022-03-11 發布 - GitHub - PyPI

此版本包含一些小的錯誤修正,沒有重大變更。

0.23.0

於 2022-03-04 發布 - GitHub - PyPI

此版本包含許多錯誤修正和一些小的變更。

重大變更

許多次要錯誤修正 (@vwxyzjn@RedTachyon@rusu24edward@Markus28 、 @dsctt 、 @andrewtanJS@tristandeleu@duburcqa)

0.22.0

於 2022-02-17 發布 - GitHub - PyPI

v0.22 發行說明

此版本代表 Gym 有史以來最大規模的變更集,並且是朝向 1.0 計畫邁進的一大步,概述於此:#2524

Gym 現在有一個新的綜合文件網站:https://www.gymlibrary.ml/

API 變更

  • Env.reset 現在接受三個新參數

  • options:可用於控制課程學習等,而無需重新初始化環境,這可能會很耗費資源 (@RedTachyon)

  • seed:環境種子 (seed) 將來可以傳遞到此 reset 參數。舊的 .seed() 方法正在被棄用,改用此參數,但為了向後相容性,在 1.0 版本發布之前,它將繼續像以前一樣運作 (@RedTachyon)

  • return_info:當設定為 True 時,reset 將傳回 obs, info。目前預設為 False,但在 Gym 1.0 中將成為預設行為 (@RedTachyon)

  • 環境名稱在註冊期間不再需要版本,並且會建議智慧型相似名稱 (@kir0ul, @JesseFarebro)

  • 向量環境現在支援 info 中的 terminal_observation,並支援批次動作空間 (@vwxyzjn, @tristandeleu)

環境變更

  • blackjack 和 frozen lake toy_text 環境現在使用 PyGame 進行精美的圖形渲染 (@1b15)
  • 將 robotics 環境移至 gym-robotics 套件 (@seungjaeryanlee, @Rohan138, @vwxyzjn) (根據 #2456 (comment) 中的討論)
  • bipedal walker 和 lunar lander 環境已合併為一個類別 (@andrewtanJS)
  • Atari 環境現在使用標準的 seeding API (@JesseFarebro)
  • 修正了 car_racing box2d 環境中的重大錯誤修正,版本已升級 (@carlosluis, @araffin)
  • 重構了所有 box2d 和 classic_control 環境,以使用 PyGame 而非 Pyglet,因為 pyglet 的問題一直是 gym 專案生命週期中最常見的 GitHub 問題來源之一 (@andrewtanJS)

其他變更

  • 移除了 DiscreteEnv 類別,內建環境不再使用它 (@carlosluis)
  • 新增了大量的型別提示 (@ikamensh, @RedTachyon)
  • Python 3.10 支援
  • 大量的額外程式碼重構、清理、錯誤訊息改進和小錯誤修正 (@vwxyzjn, @Markus28, @RushivArora, @jjshoots, @XuehaiPan, @Rohan138, @JesseFarebro, @Ericonaldo, @AdilZouitine, @RedTachyon)
  • 所有環境檔案現在都在頂部有大幅改進的 readme (文件網站會自動從中提取)
  • 作為 seeding 變更的一部分,Gym 的 RNG 已修改為使用 np.random.Generator,因為 RandomState API 已被棄用。方法 randintrandrandn 分別被 integersrandomstandard_normal 取代。因此,隨機數字產生器已從 MT19937 變更為 PCG64

完整變更日誌v0.21.0...0.22.0

v0.21.0

於 2021-10-02 發布 - GitHub - PyPI

v0.21.0 發行說明

  • 舊的 Atari 入口點已修復,該入口點在上一個版本和 ALE-Py 的升級中已損壞 (@JesseFarebro)
  • Atari 環境現在提供更清晰的錯誤訊息和警告 (@JesseFarebro)
  • 新增了一個新的外掛程式系統,以便更輕鬆地包含第三方環境 (@JesseFarebro)
  • Atari 環境現在使用新的外掛程式系統,以防止名稱衝突和其他問題 (@JesseFarebro)
  • pip install gym[atari] 不再分發 ALE (使用的 Atari 模擬器) 執行各種遊戲所需的 Atari ROM。將 ROM 安裝到 ALE 的最簡單方法是使用 AutoROM。Gym 現在有一個 AutoROM 的 hook,以便更輕鬆地進行 CI 自動化,因此使用 pip install gym[accept-rom-license] 會呼叫 AutoROM 將 ROM 新增到 ALE。您可以使用簡寫 gym[atari, accept-rom-license] 安裝整個套件。請注意,如名稱所述,透過安裝 gym[accept-rom-license],您確認您擁有安裝 ROM 的相關授權。(@JesseFarebro)
  • 修正了在 box 動作空間中使用環境的舊版 Gym 上訓練的已儲存策略載入時,意外的重大變更。(@RedTachyon)
  • Pendulum 對其物理邏輯進行了小的修正,並且版本已升級到 v1 (@RedTachyon)
  • 測試已重構為有條理的方式 (@RedTachyon)
  • Dict 空間現在具有標準的 dict 輔助方法 (@Rohan138)
  • 環境屬性現在會轉發到 wrapper (@tristandeleu)
  • Gym 現在正確地強制執行在第一次 step 之前呼叫 reset (@ahmedo42)
  • 將錯誤訊息正確地管道傳輸到 stderr (@XuehaiPan)
  • 修正了影片儲存問題 (@zlig)

此外,Gym 正在編譯第三方環境列表到我們正在開發的新文件網站中。請提交 PR 以取得遺失的環境:https://github.com/openai/gym/blob/master/docs/third_party_environments.md

完整變更日誌v0.20.0...v0.21.0

v0.20.0

於 2021-09-14 發布 - GitHub - PyPI

v0.20.0 發行說明

重大變更

  • 以 ALE-Py 取代 Atari-Py 依賴項,並升級所有版本。這是一次大規模升級,包含許多變更,請參閱 完整說明 (@JesseFarebro)
  • 請注意,ALE-Py 不包含 ROM。您可以使用 AutoROM 以兩行 bash 指令安裝 ROM (pip3 install autorom and then autorom),請參閱 https://github.com/PettingZoo-Team/AutoROM。這是 CI 等的建議方法。

重大變更和新功能

  • 新增 RecordVideo wrapper,棄用 monitor wrapper,改用它和 RecordEpisodeStatistics wrapper (@vwxyzjn)
  • 環境外部使用的依賴項 (例如,用於 wrappers) 現在位於 gym[other] 中 (@jkterry1)
  • 將演算法和未使用的 toy-text 環境 (guessing game、hotter colder、nchain、roulette、kellycoinflip) 移至第三方儲存庫 (@jkterry1, @Rohan138)
  • 修正了 MultiDiscrete 空間中的 flatten 工具和 flatdim (@tristandeleu)
  • __setitem__ 新增至 dict 空間 (@jfpettit)
  • 大幅修正了 box 空間的 .contains 方法 (@FirefoxMetzger)
  • 使 blackjack 環境完全符合 Barto 和 Sutton 書籍標準,版本升級至 v1 (@RedTachyon)
  • 新增了 NormalizeObservationNormalizeReward wrappers (@vwxyzjn)
  • __getitem____len__ 新增至 MultiDiscrete 空間 (@XuehaiPan)
  • .shape 變更為 box 空間的屬性,以防止意外行為 (@RedTachyon)

錯誤修正和升級

  • 影片錄製器能優雅地處理關閉 (@XuehaiPan)
  • setup.py 中剩餘的不必要依賴項已解決 (@jkterry1)
  • 次要的 acrobot 效能改進 (@TuckerBMorgan)
  • Pendulum 在發送 0 力時能正確渲染 (@Olimoyo)
  • 使所有經典控制環境和 bipedal-walker 的觀察 dtype 與觀察空間 dtype 一致 (@RedTachyon)
  • 移除了註冊中未使用且長期棄用的功能 (@Rohan138)
  • Framestack wrapper 現在繼承自 obswrapper (@jfpettit)
  • spaces.Tuplespaces.Dict 的 Seed 方法現在能正常運作、完全隨機、功能完整且以預期的方式運作 (@XuehaiPan, @RaghuSpaceRajan)
  • perf_counter() 取代 time(),以更好地測量短時間 (@zuoxingdong)

完整變更日誌0.19.0...v0.20.0

0.19.0

於 2021-08-13 發布 - GitHub - PyPI

Gym 0.19.0 是一個大型維護版本,也是自從 @jkterry1 成為維護者以來的第一個版本。此版本不應有重大變更。

新功能

  • 將自訂資料類型參數新增至 multidiscrete 空間 (@m-orsini)
  • 根據 SB3 和 PettingZoo 測試新增了 API 相容性測試 (@amtamasi)
  • RecordEpisodeStatics 可與 VectorEnv 搭配使用 (@vwxyzjn)

錯誤修復

  • 移除了未使用的依賴項、移除了導致較新機器上安裝問題的不必要依賴項版本需求、新增了完整的 requirements.txt 並將一般依賴項移至 extras。值得注意的是,「toy_text」不是使用的額外功能。atari-py 現在已釘選到精確的工作版本,等待切換到 ale-py (@jkterry1)
  • 修正了 FrozenLake 和 FrozenLake8x8 中的獎勵錯誤;版本升級至 v1 (@ZhiqingXiao)
    -移除了剩餘的 numpy 棄用警告 (@super-pirata)
  • 修正了影片錄製問題 (@mahiuchun, @zlig)
  • EZ pickle 參數修正 (@zzyunzhi, @Indoril007)
  • 其他非常小的 (非重大) 修正

其他

  • 移除了少量無用程式碼 (@jkterry1)
  • 大量的錯字、CI 和文件修正 (主要是 @cclauss)
  • 新的 readme 和更新的第三方環境列表 (@jkterry1)
  • 程式碼現在完全符合 flake8 規範,透過 black 進行格式化 (@cclauss)

0.12.5

於 2019-05-29 發布 - GitHub - PyPI

v0.9.6

於 2018-02-01 發布 - GitHub - PyPI

  • 現在您的 EnvWrapper 子類別應定義 stepresetrendercloseseed,而不是底線方法名稱。
  • 移除了 board_gamedebuggingsafetyparameter_tuning 環境,因為它們未由 OpenAI 維護。我們鼓勵作者和使用者為這些環境建立新的儲存庫。
  • MultiDiscrete 動作空間變更為範圍從 [0, ..., n-1] 而非 [a, ..., b-1]
  • 不再有 render(close=True),請使用環境特定的方法來關閉渲染。
  • 移除了 scoreboard 目錄,因為該網站已不存在。
  • gym/monitoring 移至 gym/wrappers/monitoring
  • dtype 新增至 Space
  • 不再使用 python 的內建模組,改用 gym.logger

v0.9.5

於 2018-01-26 發布 - GitHub - PyPI

v0.7.4

於 2017-03-05 發布 - GitHub - PyPI

v0.7.3

於 2017-02-01 發布 - GitHub - PyPI