外部環境

第一方環境

Farama 基金會維護了許多其他專案,這些專案使用 Gymnasium API,環境包括:網格世界 (Minigrid)、機器人學 (Gymnasium-Robotics)、3D 導航 (Miniworld)、網頁互動 (MiniWoB++)、街機遊戲 (Arcade Learning Environment)、Doom (ViZDoom)、元目標機器人學 (Metaworld)、自動駕駛 (HighwayEnv)、復古遊戲 (stable-retro) 以及更多。

Farama 基金會還維護了 RL 的其他 API,包括:多智能體 RL (PettingZoo)、離線 RL (Minari)、多目標 RL (MO-Gymnasium)、目標 RL (Gymnasium-Robotics)。

使用 Gymnasium 的第三方環境

此頁面包含非 Farama 基金會維護的環境,因此無法保證其功能符合預期。

如果您想貢獻環境,請在 Discord 上聯繫,然後編輯此檔案提交 PR,更多說明可以在該檔案內找到

自動駕駛環境

自動駕駛車輛和交通管理。

生物 / 醫療環境

與生物系統互動。

經濟 / 金融環境

所有與經濟相關的事物。

電力 / 能源環境

管理電子的流動。

遊戲環境

桌遊、電玩遊戲和所有其他互動式娛樂媒介。

數學 / 計算

減少計算運算、證明數學定理等等。

機器人學環境

自主機器人。

電信系統環境

互動和/或管理無線和/或有線電信系統。

其他

  • Buffalo-Gym:多臂老虎機 Gymnasium

    Gymnasium version dependency GitHub stars

    Buffalo-Gym 是一個多臂老虎機 (MAB) gymnasium,主要旨在協助偵錯 RL 實作。MAB 通常很容易推理智能體正在學習什麼以及是否正確。Buffalo-gym 包含老虎機、情境老虎機和具有別名的情境老虎機。

  • CARL:情境自適應 RL

    Gymnasium version dependency GitHub stars

    熱門強化學習環境的情境擴展,可實現泛化的訓練和測試分佈,例如具有可變桿長的 CartPole 或具有不同地面摩擦力的 Brax 機器人。

  • DACBench:動態演算法配置的基準

    Gymnasium version dependency GitHub stars

    用於動態演算法配置的基準函式庫。其重點在於不同 DAC 方法的可重現性和可比較性,以及優化過程的簡易分析。

  • gym-cellular-automata:細胞自動機環境

    Gymnasium version dependency GitHub stars

    智能體透過變更其細胞狀態與細胞自動機互動的環境。

  • Gym-Gridworlds:可自訂的極簡網格世界集合

    Gymnasium version dependency GitHub stars

    預設類別實作了「前往目標」,但它可以輕鬆自訂以用於不同任務,具有各種網格、獎勵、動力學和任務。它支援不同的觀察類型 (離散、座標、二元、像素、部分)。適用於快速測試和原型 RL 演算法,包括表格型和函數逼近。

  • matrix-mdp:輕鬆建立離散 MDP

    Gymnasium version dependency GitHub stars

    一個輕鬆實作離散 MDP 作為 gym 環境的環境。將一組矩陣 (P_0(s)P(s'| s, a)R(s', s, a)) 轉換為代表由這些動力學支配的離散 MDP 的 gym 環境。

  • SimpleGrid:用於 Gymnasium 的簡單網格環境

    Gymnasium version dependency GitHub stars

    SimpleGrid 是一個用於 Gymnasium 的超簡單且極簡的網格環境。它易於使用和自訂,旨在提供一個用於快速測試和原型化不同 RL 演算法的環境。

使用 Gym 的第三方環境

有大量第三方環境使用各種版本的 Gym。其中許多可以改編為與 gymnasium 一起使用 (請參閱與 Gym 的相容性),但不保證完全正常運作。

電玩遊戲環境

機器人學環境

自動駕駛環境

其他環境