PARL Logo
latest

概览

  • 特点
  • 框架结构
  • 简易高效的并行接口

安装

  • 安装

教程

  • 快速入门:解决CartPole问题
  • 子模块说明
  • 自定义新算法
  • 模型参数管理
  • 绘制训练曲线
  • 表格输出实验数据

算法接口文档

  • Policy Gradient
  • DQN
  • DDPG
  • DDQN
  • OAC
  • A2C
  • TD3
  • QMIX
  • SAC
  • PPO
  • MADDPG

简易高效的并行接口

  • Xparl并行概览
  • 使用教程
  • 加速案例
  • 加速案例(后台模式)
  • GPU Cluster
  • 如何debug
  • 分发本地文件
  • 序列化加速(非必须)

APIs

  • parl.Model
  • parl.Algorithm
  • parl.Agent
  • parl.remote_class
  • parl.connect

Frequently Asked Questions

  • xparl questions
  • RL questions

EvoKit

  • 简介
  • 入门案例
  • 产业级线上案例
PARL
  • 搜索


© 版权所有 2021, nlp-ol@baidu.com. Revision 1fc50bf5.

Built with Sphinx using a theme provided by Read the Docs.