PARL Logo
latest

概览

  • 特点
  • 框架结构
  • 简易高效的并行接口

安装

  • 安装

教程

  • 快速入门:解决CartPole问题
  • 子模块说明
  • 自定义新算法
  • 模型参数管理
  • 绘制训练曲线
  • 表格输出实验数据

算法接口文档

  • Policy Gradient
  • DQN
  • DDPG
  • DDQN
  • OAC
  • A2C
  • TD3
  • QMIX
  • SAC
  • PPO
  • MADDPG

简易高效的并行接口

  • Xparl并行概览
  • 使用教程
  • 加速案例
  • 加速案例(后台模式)
  • GPU Cluster
  • 如何debug
  • 分发本地文件
  • 序列化加速(非必须)

APIs

  • parl.Model
  • parl.Algorithm
  • parl.Agent
  • parl.remote_class
  • parl.connect

Frequently Asked Questions

  • xparl questions
  • RL questions

EvoKit

  • 简介
  • 入门案例
  • 产业级线上案例
PARL
  • 概览:模块代码

代码可用的所有模块

  • parl.algorithms.fluid.impala.impala
  • parl.algorithms.paddle.a2c
  • parl.algorithms.paddle.ddpg
  • parl.algorithms.paddle.ddqn
  • parl.algorithms.paddle.dqn
  • parl.algorithms.paddle.maddpg
  • parl.algorithms.paddle.oac
  • parl.algorithms.paddle.policy_gradient
  • parl.algorithms.paddle.ppo
  • parl.algorithms.paddle.qmix
  • parl.algorithms.paddle.sac
  • parl.algorithms.paddle.td3
  • parl.core.paddle.agent
  • parl.core.paddle.algorithm
  • parl.core.paddle.model
  • parl.remote.client
  • parl.remote.remote_decorator

© 版权所有 2021, nlp-ol@baidu.com. Revision 1fc50bf5.

Built with Sphinx using a theme provided by Read the Docs.