├── .gitignore
├── README.md
├── deep_rl_for_swarms
    ├── __init__.py
    ├── common
    │   ├── __init__.py
    │   ├── act_wrapper.py
    │   ├── bench
    │   │   ├── __init__.py
    │   │   ├── benchmarks.py
    │   │   └── monitor.py
    │   ├── cg.py
    │   ├── cmd_util.py
    │   ├── console_util.py
    │   ├── dataset.py
    │   ├── distributions.py
    │   ├── logger.py
    │   ├── math_util.py
    │   ├── misc_util.py
    │   ├── mpi_adam.py
    │   ├── mpi_fork.py
    │   ├── mpi_moments.py
    │   ├── mpi_running_mean_std.py
    │   ├── running_mean_std.py
    │   ├── schedules.py
    │   ├── segment_tree.py
    │   ├── sim_policy.py
    │   └── tf_util.py
    ├── ma_envs
    │   ├── __init__.py
    │   ├── agents
    │   │   ├── __init__.py
    │   │   └── point_agents
    │   │   │   ├── __init__.py
    │   │   │   ├── evader_agent.py
    │   │   │   ├── pursuer_agent.py
    │   │   │   └── rendezvous_agent.py
    │   ├── base.py
    │   ├── commons
    │   │   ├── __init__.py
    │   │   └── utils.py
    │   └── envs
    │   │   ├── __init__.py
    │   │   └── point_envs
    │   │       ├── __init__.py
    │   │       ├── pursuit_evasion.py
    │   │       ├── pursuit_evasion_multi.py
    │   │       └── rendezvous.py
    ├── policies
    │   ├── __init__.py
    │   ├── mean_embedding.py
    │   ├── mlp_mean_embedding_policy.py
    │   ├── mlp_multi_mean_embedding_policy.py
    │   ├── mlp_multi_policy_split.py
    │   ├── mlp_policy.py
    │   └── mlp_policy_split.py
    ├── rl_algo
    │   ├── __init__.py
    │   └── trpo_mpi
    │   │   ├── README.md
    │   │   ├── __init__.py
    │   │   ├── trpo_mpi.py
    │   │   └── trpo_mpi_class.py
    └── run_multiagent_trpo.py
└── setup.py


/.gitignore:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/.gitignore


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/README.md


--------------------------------------------------------------------------------
/deep_rl_for_swarms/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/__init__.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/__init__.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/act_wrapper.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/act_wrapper.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/bench/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/bench/__init__.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/bench/benchmarks.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/bench/benchmarks.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/bench/monitor.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/bench/monitor.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/cg.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/cg.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/cmd_util.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/cmd_util.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/console_util.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/console_util.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/dataset.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/dataset.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/distributions.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/distributions.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/logger.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/logger.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/math_util.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/math_util.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/misc_util.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/misc_util.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/mpi_adam.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/mpi_adam.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/mpi_fork.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/mpi_fork.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/mpi_moments.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/mpi_moments.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/mpi_running_mean_std.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/mpi_running_mean_std.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/running_mean_std.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/running_mean_std.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/schedules.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/schedules.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/segment_tree.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/segment_tree.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/sim_policy.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/sim_policy.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/common/tf_util.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/common/tf_util.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/agents/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/agents/point_agents/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/agents/point_agents/evader_agent.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/agents/point_agents/evader_agent.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/agents/point_agents/pursuer_agent.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/agents/point_agents/pursuer_agent.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/agents/point_agents/rendezvous_agent.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/agents/point_agents/rendezvous_agent.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/base.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/base.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/commons/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/commons/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/commons/utils.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/envs/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/envs/point_envs/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/envs/point_envs/pursuit_evasion.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/envs/point_envs/pursuit_evasion.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/envs/point_envs/pursuit_evasion_multi.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/envs/point_envs/pursuit_evasion_multi.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/ma_envs/envs/point_envs/rendezvous.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/ma_envs/envs/point_envs/rendezvous.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/mean_embedding.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/policies/mean_embedding.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/mlp_mean_embedding_policy.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/policies/mlp_mean_embedding_policy.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/mlp_multi_mean_embedding_policy.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/policies/mlp_multi_mean_embedding_policy.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/mlp_multi_policy_split.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/policies/mlp_multi_policy_split.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/mlp_policy.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/policies/mlp_policy.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/policies/mlp_policy_split.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/policies/mlp_policy_split.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/rl_algo/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/rl_algo/trpo_mpi/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/rl_algo/trpo_mpi/README.md


--------------------------------------------------------------------------------
/deep_rl_for_swarms/rl_algo/trpo_mpi/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/deep_rl_for_swarms/rl_algo/trpo_mpi/trpo_mpi.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/rl_algo/trpo_mpi/trpo_mpi.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/rl_algo/trpo_mpi/trpo_mpi_class.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/rl_algo/trpo_mpi/trpo_mpi_class.py


--------------------------------------------------------------------------------
/deep_rl_for_swarms/run_multiagent_trpo.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/deep_rl_for_swarms/run_multiagent_trpo.py


--------------------------------------------------------------------------------
/setup.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ALRhub/deep_rl_for_swarms/HEAD/setup.py


--------------------------------------------------------------------------------