PARL Logo
latest

概览

  • 特点
  • 框架结构
  • 简易高效的并行接口

安装

  • 安装

教程

  • 快速入门:解决CartPole问题
  • 子模块说明
  • 自定义新算法
  • 模型参数管理
  • 绘制训练曲线
  • 表格输出实验数据

算法接口文档

  • Policy Gradient
  • DQN
  • DDPG
  • DDQN
  • OAC
  • A2C
  • TD3
  • QMIX
  • SAC
  • PPO
  • MADDPG

简易高效的并行接口

  • Xparl并行概览
  • 使用教程
  • 加速案例
  • 加速案例(后台模式)
  • GPU Cluster
  • 如何debug
  • 分发本地文件
  • 序列化加速(非必须)

APIs

  • parl.Model
  • parl.Algorithm
  • parl.Agent
  • parl.remote_class
  • parl.connect

Frequently Asked Questions

  • xparl questions
  • RL questions

EvoKit

  • 简介
  • 入门案例
  • 产业级线上案例
PARL
  • PARL
  • Edit on GitHub

PARL¶

PARL是一个主打高性能、稳定复现、轻量级的强化学习框架。

_images/PARL-logo-1.png

概览

  • 特点
  • 框架结构
  • 简易高效的并行接口

安装

  • 安装

教程

  • 快速入门:解决CartPole问题
  • 子模块说明
  • 自定义新算法
  • 模型参数管理
  • 绘制训练曲线
  • 表格输出实验数据

算法接口文档

  • Policy Gradient
    • PolicyGradient
  • DQN
    • DQN
  • DDPG
    • DDPG
  • DDQN
    • DDQN
  • OAC
    • OAC
  • A2C
    • A2C
  • TD3
    • TD3
  • QMIX
    • QMIX
  • SAC
    • SAC
  • PPO
    • PPO
  • MADDPG
    • MADDPG

简易高效的并行接口

  • Xparl并行概览
    • 简单易用
    • 高性能
    • Web 页面监控集群信息
    • 全框架兼容
    • 为什么用PARL
  • 使用教程
    • 配置命令
    • 加入更多CPU资源
    • 示例
    • 关闭集群
    • 扩展阅读
  • 加速案例
  • 加速案例(后台模式)
  • GPU Cluster
  • 如何debug
  • 分发本地文件
    • 示例:
  • 序列化加速(非必须)
    • 性能对比
    • 对比结论

APIs

  • parl.Model
  • parl.Algorithm
  • parl.Agent
  • parl.remote_class
  • parl.connect

Frequently Asked Questions

  • xparl questions
  • RL questions

EvoKit

  • 简介
  • 入门案例
  • 产业级线上案例
Next

© 版权所有 2021, nlp-ol@baidu.com. Revision 1fc50bf5.

Built with Sphinx using a theme provided by Read the Docs.