Wrapper 列表¶
Gymnasium 提供了許多常用的 wrappers,如下列表所示。更多資訊可以在關於 wrapper 類型的頁面中找到。
名稱 |
描述 |
---|---|
實作 Atari 環境的常用預處理技術(不包含幀堆疊)。 |
|
當達到 terminated 或 truncated 狀態時,包裝的環境會自動重置。 |
|
將傳遞給 |
|
將環境的獎勵裁剪在上限和下限之間。 |
|
為環境返回的 observation 增加延遲。 |
|
將 observation 陣列的 dtype 修改為指定的 dtype。 |
|
透過一組鍵或索引來過濾 Dict 或 Tuple observation spaces。 |
|
展平環境的 observation space 以及來自 |
|
以滾動方式堆疊來自最後 |
|
將 |
|
允許對支援 “rgb_array” rendering 的環境進行類似人類的 rendering。 |
|
包裝基於 Jax 的環境,使其可以與 NumPy 陣列互動。 |
|
包裝基於 Jax 的環境,使其可以與 PyTorch Tensors 互動。 |
|
跳過第 N 幀(observation)並返回最後兩個 observations 之間的最大值。 |
|
將 observations 正規化,使其以平均值為中心並具有單位變異數。 |
|
正規化即時獎勵,使其指數移動平均值具有固定的變異數。 |
|
包裝基於 NumPy 的環境,使其可以與 PyTorch Tensors 互動。 |
|
如果在 |
|
一個被動環境檢查器 wrapper,它包圍 |
|
此 wrapper 將追蹤累積獎勵和 episode 長度。 |
|
使用環境的 render 函數錄製環境 episodes 的影片。 |
|
收集環境的 rendered 幀,例如 |
|
將 rendered observations 包含在環境的 observations 中。 |
|
將環境的 |
|
將環境的 |
|
將基於陣列的 observations 重新塑造成指定的形狀。 |
|
使用 OpenCV 將影像 observations 調整大小為指定的形狀。 |
|
增加一個機率,使 action 在同一個 |
|
使用 episode 內經過的時間步數來擴充 observation。 |
|
透過在超過最大時間步數時截斷環境來限制環境的步數。 |
|
在將修改後的值傳遞給環境 |
|
將函數應用於從環境的 |
|
將函數應用於從環境的 |
僅限 Vector 的 Wrappers¶
名稱 |
描述 |
---|---|
將向量化環境的 infos 從 |
|
為向量環境向量化單 agent 轉換 action wrapper。 |
|
為向量環境向量化單 agent 轉換 observation wrapper。 |
|
為向量環境向量化單 agent 轉換 reward wrapper。 |