├── .gitignore
├── LICENSE
├── README.md
├── conda_env.yml
├── diffusion_reward
    ├── configs
    │   ├── models
    │   │   ├── codec_models
    │   │   │   └── vqgan
    │   │   │   │   ├── dataset
    │   │   │   │       ├── adroit.yaml
    │   │   │   │       └── metaworld.yaml
    │   │   │   │   └── default.yaml
    │   │   └── video_models
    │   │   │   ├── videogpt
    │   │   │       ├── dataset
    │   │   │       │   ├── adroit.yaml
    │   │   │       │   └── metaworld.yaml
    │   │   │       └── default.yaml
    │   │   │   └── vqdiffusion
    │   │   │       ├── dataset
    │   │   │           ├── adroit.yaml
    │   │   │           └── metaworld.yaml
    │   │   │       └── default.yaml
    │   └── rl
    │   │   ├── agent
    │   │       └── drqv2.yaml
    │   │   ├── default.yaml
    │   │   ├── reward
    │   │       ├── amp.yaml
    │   │       ├── diffusion_reward.yaml
    │   │       ├── expl_reward
    │   │       │   └── rnd.yaml
    │   │       ├── rnd.yaml
    │   │       └── viper.yaml
    │   │   └── task
    │   │       ├── assembly-v2.yaml
    │   │       ├── door-v0.yaml
    │   │       ├── hammer-v0.yaml
    │   │       └── pen-v0.yaml
    ├── envs
    │   ├── __init__.py
    │   ├── adroit.py
    │   ├── metaworld.py
    │   └── wrapper.py
    ├── models
    │   ├── codec_models
    │   │   └── vqgan
    │   │   │   ├── README.md
    │   │   │   ├── codebook.py
    │   │   │   ├── decoder.py
    │   │   │   ├── discriminator.py
    │   │   │   ├── encoder.py
    │   │   │   ├── helper.py
    │   │   │   ├── lpips.py
    │   │   │   ├── utils.py
    │   │   │   └── vqgan.py
    │   ├── reward_models
    │   │   ├── __init__.py
    │   │   ├── amp.py
    │   │   ├── diffusion_reward.py
    │   │   ├── expl_rewards
    │   │   │   └── rnd.py
    │   │   ├── rnd.py
    │   │   ├── statistics
    │   │   │   ├── diffusion_reward
    │   │   │   │   ├── entropy
    │   │   │   │   │   ├── adroit.yaml
    │   │   │   │   │   └── metaworld.yaml
    │   │   │   │   └── likelihood
    │   │   │   │   │   ├── adroit.yaml
    │   │   │   │   │   └── metaworld.yaml
    │   │   │   └── viper
    │   │   │   │   ├── entropy
    │   │   │   │       ├── adroit.yaml
    │   │   │   │       └── metaworld.yaml
    │   │   │   │   └── likelihood
    │   │   │   │       ├── adroit.yaml
    │   │   │   │       └── metaworld.yaml
    │   │   └── viper.py
    │   └── video_models
    │   │   ├── videogpt
    │   │       ├── README.md
    │   │       ├── helper.py
    │   │       ├── mingpt.py
    │   │       ├── transformer.py
    │   │       └── utils.py
    │   │   └── vqdiffusion
    │   │       ├── README.md
    │   │       ├── data
    │   │           ├── build.py
    │   │           └── dataset.py
    │   │       ├── distributed
    │   │           ├── distributed.py
    │   │           └── launch.py
    │   │       ├── engine
    │   │           ├── clip_grad_norm.py
    │   │           ├── ema.py
    │   │           ├── logger.py
    │   │           ├── lr_scheduler.py
    │   │           └── solver.py
    │   │       ├── modeling
    │   │           ├── build.py
    │   │           ├── codecs
    │   │           │   ├── base_codec.py
    │   │           │   └── image_codec
    │   │           │   │   └── vqgan.py
    │   │           ├── embeddings
    │   │           │   ├── base_embedding.py
    │   │           │   ├── dalle_mask_image_embedding.py
    │   │           │   └── frame_embedding.py
    │   │           ├── models
    │   │           │   └── frame_conditional_dalle.py
    │   │           ├── transformers
    │   │           │   ├── diffusion_transformer.py
    │   │           │   └── transformer_utils.py
    │   │           └── utils
    │   │           │   └── misc.py
    │   │       └── utils
    │   │           ├── io.py
    │   │           └── misc.py
    └── rl
    │   └── drqv2
    │       ├── agent.py
    │       ├── logger.py
    │       ├── replay_buffer.py
    │       ├── utils.py
    │       └── video.py
├── docs
    └── diffusion_reward_overview.png
├── env_dependencies
    ├── mj_envs
    │   ├── LICENSE
    │   ├── README.md
    │   ├── dependencies
    │   │   └── Adroit
    │   │   │   ├── Adroit_hand.xml
    │   │   │   ├── Adroit_hand_withOverlay.xml
    │   │   │   ├── LICENSE
    │   │   │   ├── README.md
    │   │   │   ├── gallery
    │   │   │       ├── news.JPG
    │   │   │       └── projects.JPG
    │   │   │   └── resources
    │   │   │       ├── assets.xml
    │   │   │       ├── chain.xml
    │   │   │       ├── chain1.xml
    │   │   │       ├── joint_position_actuation.xml
    │   │   │       ├── meshes
    │   │   │           ├── F1.stl
    │   │   │           ├── F2.stl
    │   │   │           ├── F3.stl
    │   │   │           ├── TH1_z.stl
    │   │   │           ├── TH2_z.stl
    │   │   │           ├── TH3_z.stl
    │   │   │           ├── arm_base.stl
    │   │   │           ├── arm_trunk.stl
    │   │   │           ├── arm_trunk_asmbly.stl
    │   │   │           ├── distal_ellipsoid.stl
    │   │   │           ├── elbow_flex.stl
    │   │   │           ├── elbow_rotate_motor.stl
    │   │   │           ├── elbow_rotate_muscle.stl
    │   │   │           ├── forearm_Cy_PlateAsmbly(muscle_cone).stl
    │   │   │           ├── forearm_Cy_PlateAsmbly.stl
    │   │   │           ├── forearm_PlateAsmbly.stl
    │   │   │           ├── forearm_electric.stl
    │   │   │           ├── forearm_electric_cvx.stl
    │   │   │           ├── forearm_muscle.stl
    │   │   │           ├── forearm_simple.stl
    │   │   │           ├── forearm_simple_cvx.stl
    │   │   │           ├── forearm_weight.stl
    │   │   │           ├── knuckle.stl
    │   │   │           ├── lfmetacarpal.stl
    │   │   │           ├── palm.stl
    │   │   │           ├── upper_arm.stl
    │   │   │           ├── upper_arm_asmbl_shoulder.stl
    │   │   │           ├── upper_arm_ass.stl
    │   │   │           └── wrist.stl
    │   │   │       ├── tendon_torque_actuation.xml
    │   │   │       └── textures
    │   │   │           ├── darkwood.png
    │   │   │           ├── dice.png
    │   │   │           ├── foil.png
    │   │   │           ├── marble.png
    │   │   │           ├── silverRaw.png
    │   │   │           ├── skin.png
    │   │   │           ├── square.png
    │   │   │           ├── wood.png
    │   │   │           └── woodb.png
    │   ├── mj_envs
    │   │   ├── __init__.py
    │   │   ├── hand_manipulation_suite
    │   │   │   ├── __init__.py
    │   │   │   ├── assets
    │   │   │   │   ├── DAPG_Adroit.xml
    │   │   │   │   ├── DAPG_assets.xml
    │   │   │   │   ├── DAPG_door.xml
    │   │   │   │   ├── DAPG_hammer.xml
    │   │   │   │   ├── DAPG_pen.xml
    │   │   │   │   ├── DAPG_relocate.xml
    │   │   │   │   └── tasks.jpg
    │   │   │   ├── door_v0.py
    │   │   │   ├── hammer_v0.py
    │   │   │   ├── pen_v0.py
    │   │   │   └── relocate_v0.py
    │   │   └── utils
    │   │   │   ├── quatmath.py
    │   │   │   └── visualize_env.py
    │   └── setup.py
    └── mjrl
    │   ├── LICENSE
    │   ├── README.md
    │   ├── examples
    │       ├── README.md
    │       ├── behavior_clone.py
    │       ├── example_configs
    │       │   ├── hopper_npg.txt
    │       │   ├── swimmer_npg.txt
    │       │   └── swimmer_ppo.txt
    │       ├── linear_nn_comparison.py
    │       └── policy_opt_job_script.py
    │   ├── mjrl
    │       ├── __init__.py
    │       ├── algos
    │       │   ├── __init__.py
    │       │   ├── batch_reinforce.py
    │       │   ├── behavior_cloning.py
    │       │   ├── dapg.py
    │       │   ├── mbac.py
    │       │   ├── model_accel
    │       │   │   ├── __init__.py
    │       │   │   ├── model_accel_npg.py
    │       │   │   ├── model_learning_mpc.py
    │       │   │   ├── nn_dynamics.py
    │       │   │   ├── run_experiments
    │       │   │   │   ├── configs
    │       │   │   │   │   ├── point_mass.txt
    │       │   │   │   │   └── reacher.txt
    │       │   │   │   ├── run_model_accel_npg.py
    │       │   │   │   ├── sandbox
    │       │   │   │   │   ├── example_config_mpc.txt
    │       │   │   │   │   └── run_model_learning_mpc.py
    │       │   │   │   └── utils
    │       │   │   │   │   ├── reward_functions
    │       │   │   │   │       ├── __init__.py
    │       │   │   │   │       └── mjrl_point_mass.py
    │       │   │   │   │   ├── visualize_policy.py
    │       │   │   │   │   └── visualize_trajectories.py
    │       │   │   └── sampling.py
    │       │   ├── npg_cg.py
    │       │   ├── ppo_clip.py
    │       │   └── trpo.py
    │       ├── baselines
    │       │   ├── __init__.py
    │       │   ├── linear_baseline.py
    │       │   ├── mlp_baseline.py
    │       │   ├── quadratic_baseline.py
    │       │   └── zero_baseline.py
    │       ├── envs
    │       │   ├── __init__.py
    │       │   ├── assets
    │       │   │   ├── peg_insertion.xml
    │       │   │   ├── point_mass.xml
    │       │   │   ├── sawyer.xml
    │       │   │   └── swimmer.xml
    │       │   ├── mujoco_env.py
    │       │   ├── peg_insertion_sawyer.py
    │       │   ├── point_mass.py
    │       │   ├── reacher_sawyer.py
    │       │   └── swimmer.py
    │       ├── policies
    │       │   ├── __init__.py
    │       │   ├── gaussian_linear.py
    │       │   ├── gaussian_mlp.py
    │       │   └── mpc_actor.py
    │       ├── samplers
    │       │   ├── __init__.py
    │       │   └── core.py
    │       └── utils
    │       │   ├── __init__.py
    │       │   ├── cg_solve.py
    │       │   ├── fc_network.py
    │       │   ├── get_environment.py
    │       │   ├── gym_env.py
    │       │   ├── logger.py
    │       │   ├── make_train_plots.py
    │       │   ├── optimize_model.py
    │       │   ├── plot_from_logs.py
    │       │   ├── process_samples.py
    │       │   ├── tensor_utils.py
    │       │   ├── train_agent.py
    │       │   └── visualize_policy.py
    │   ├── setup.py
    │   ├── setup
    │       ├── README.md
    │       └── env.yml
    │   └── tests
    │       ├── hydra
    │           ├── config
    │           │   └── hydra_npg_config.yaml
    │           └── hydra_policy_opt_job_script.py
    │       ├── point_mass_test.py
    │       └── visualizer_test.py
├── scripts
    ├── run
    │   ├── codec_model
    │   │   ├── vqgan_adroit.sh
    │   │   └── vqgan_metaworld.sh
    │   ├── rl
    │   │   ├── drqv2_adroit_amp.sh
    │   │   ├── drqv2_adroit_diffusion_reward.sh
    │   │   ├── drqv2_adroit_raw_sparse_reward.sh
    │   │   ├── drqv2_adroit_rnd.sh
    │   │   ├── drqv2_adroit_viper.sh
    │   │   ├── drqv2_adroit_viper_std.sh
    │   │   ├── drqv2_metaworld_amp.sh
    │   │   ├── drqv2_metaworld_diffusion_reward.sh
    │   │   ├── drqv2_metaworld_raw_sparse_reward.sh
    │   │   ├── drqv2_metaworld_rnd.sh
    │   │   ├── drqv2_metaworld_viper.sh
    │   │   └── drqv2_metaworld_viper_std.sh
    │   └── video_model
    │   │   ├── videogpt_adroit.sh
    │   │   ├── videogpt_metaworld.sh
    │   │   ├── vqdiffusion_adroit.sh
    │   │   └── vqdiffusion_metaworld.sh
    ├── train_drqv2.py
    ├── train_videogpt.py
    ├── train_vqdiffusion.py
    └── train_vqgan.py
└── setup.py


/.gitignore:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/.gitignore


--------------------------------------------------------------------------------
/LICENSE:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/LICENSE


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/README.md


--------------------------------------------------------------------------------
/conda_env.yml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/conda_env.yml


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/codec_models/vqgan/dataset/adroit.yaml:
--------------------------------------------------------------------------------
1 | domain: adroit
2 | latent_size: 8


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/codec_models/vqgan/dataset/metaworld.yaml:
--------------------------------------------------------------------------------
1 | domain: metaworld
2 | latent_size: 8


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/codec_models/vqgan/default.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/models/codec_models/vqgan/default.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/video_models/videogpt/dataset/adroit.yaml:
--------------------------------------------------------------------------------
1 | domain: adroit
2 | latent_size: 8
3 | epochs: 5000


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/video_models/videogpt/dataset/metaworld.yaml:
--------------------------------------------------------------------------------
1 | domain: metaworld
2 | latent_size: 8
3 | epochs: 5000


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/video_models/videogpt/default.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/models/video_models/videogpt/default.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/video_models/vqdiffusion/dataset/adroit.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/models/video_models/vqdiffusion/dataset/adroit.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/video_models/vqdiffusion/dataset/metaworld.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/models/video_models/vqdiffusion/dataset/metaworld.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/models/video_models/vqdiffusion/default.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/models/video_models/vqdiffusion/default.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/agent/drqv2.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/agent/drqv2.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/default.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/default.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/reward/amp.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/reward/amp.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/reward/diffusion_reward.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/reward/diffusion_reward.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/reward/expl_reward/rnd.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/reward/expl_reward/rnd.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/reward/rnd.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/reward/rnd.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/reward/viper.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/reward/viper.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/task/assembly-v2.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/task/assembly-v2.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/task/door-v0.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/task/door-v0.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/task/hammer-v0.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/task/hammer-v0.yaml


--------------------------------------------------------------------------------
/diffusion_reward/configs/rl/task/pen-v0.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/configs/rl/task/pen-v0.yaml


--------------------------------------------------------------------------------
/diffusion_reward/envs/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/envs/__init__.py


--------------------------------------------------------------------------------
/diffusion_reward/envs/adroit.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/envs/adroit.py


--------------------------------------------------------------------------------
/diffusion_reward/envs/metaworld.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/envs/metaworld.py


--------------------------------------------------------------------------------
/diffusion_reward/envs/wrapper.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/envs/wrapper.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/README.md


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/codebook.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/codebook.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/decoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/decoder.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/discriminator.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/discriminator.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/encoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/encoder.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/helper.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/helper.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/lpips.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/lpips.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/utils.py


--------------------------------------------------------------------------------
/diffusion_reward/models/codec_models/vqgan/vqgan.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/codec_models/vqgan/vqgan.py


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/__init__.py


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/amp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/amp.py


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/diffusion_reward.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/diffusion_reward.py


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/expl_rewards/rnd.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/expl_rewards/rnd.py


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/rnd.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/rnd.py


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/diffusion_reward/entropy/adroit.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/diffusion_reward/entropy/adroit.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/diffusion_reward/entropy/metaworld.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/diffusion_reward/entropy/metaworld.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/diffusion_reward/likelihood/adroit.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/diffusion_reward/likelihood/adroit.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/diffusion_reward/likelihood/metaworld.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/diffusion_reward/likelihood/metaworld.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/viper/entropy/adroit.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/viper/entropy/adroit.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/viper/entropy/metaworld.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/viper/entropy/metaworld.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/viper/likelihood/adroit.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/viper/likelihood/adroit.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/statistics/viper/likelihood/metaworld.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/statistics/viper/likelihood/metaworld.yaml


--------------------------------------------------------------------------------
/diffusion_reward/models/reward_models/viper.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/reward_models/viper.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/videogpt/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/videogpt/README.md


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/videogpt/helper.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/videogpt/helper.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/videogpt/mingpt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/videogpt/mingpt.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/videogpt/transformer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/videogpt/transformer.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/videogpt/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/videogpt/utils.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/README.md


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/data/build.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/data/build.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/data/dataset.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/data/dataset.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/distributed/distributed.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/distributed/distributed.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/distributed/launch.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/distributed/launch.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/engine/clip_grad_norm.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/engine/clip_grad_norm.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/engine/ema.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/engine/ema.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/engine/logger.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/engine/logger.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/engine/lr_scheduler.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/engine/lr_scheduler.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/engine/solver.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/engine/solver.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/build.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/build.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/codecs/base_codec.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/codecs/base_codec.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/codecs/image_codec/vqgan.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/codecs/image_codec/vqgan.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/embeddings/base_embedding.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/embeddings/base_embedding.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/embeddings/dalle_mask_image_embedding.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/embeddings/dalle_mask_image_embedding.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/embeddings/frame_embedding.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/embeddings/frame_embedding.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/models/frame_conditional_dalle.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/models/frame_conditional_dalle.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/transformers/diffusion_transformer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/transformers/diffusion_transformer.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/transformers/transformer_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/transformers/transformer_utils.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/modeling/utils/misc.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/modeling/utils/misc.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/utils/io.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/utils/io.py


--------------------------------------------------------------------------------
/diffusion_reward/models/video_models/vqdiffusion/utils/misc.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/models/video_models/vqdiffusion/utils/misc.py


--------------------------------------------------------------------------------
/diffusion_reward/rl/drqv2/agent.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/rl/drqv2/agent.py


--------------------------------------------------------------------------------
/diffusion_reward/rl/drqv2/logger.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/rl/drqv2/logger.py


--------------------------------------------------------------------------------
/diffusion_reward/rl/drqv2/replay_buffer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/rl/drqv2/replay_buffer.py


--------------------------------------------------------------------------------
/diffusion_reward/rl/drqv2/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/rl/drqv2/utils.py


--------------------------------------------------------------------------------
/diffusion_reward/rl/drqv2/video.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/diffusion_reward/rl/drqv2/video.py


--------------------------------------------------------------------------------
/docs/diffusion_reward_overview.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/docs/diffusion_reward_overview.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/LICENSE:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/LICENSE


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/README.md


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/Adroit_hand.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/Adroit_hand.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/Adroit_hand_withOverlay.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/Adroit_hand_withOverlay.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/LICENSE:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/LICENSE


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/README.md


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/gallery/news.JPG:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/gallery/news.JPG


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/gallery/projects.JPG:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/gallery/projects.JPG


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/assets.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/assets.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/chain.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/chain.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/chain1.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/chain1.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/joint_position_actuation.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/joint_position_actuation.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/F1.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/F1.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/F2.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/F2.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/F3.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/F3.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/TH1_z.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/TH1_z.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/TH2_z.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/TH2_z.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/TH3_z.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/TH3_z.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/arm_base.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/arm_base.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/arm_trunk.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/arm_trunk.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/arm_trunk_asmbly.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/arm_trunk_asmbly.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/distal_ellipsoid.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/distal_ellipsoid.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/elbow_flex.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/elbow_flex.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/elbow_rotate_motor.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/elbow_rotate_motor.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/elbow_rotate_muscle.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/elbow_rotate_muscle.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_Cy_PlateAsmbly(muscle_cone).stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_Cy_PlateAsmbly(muscle_cone).stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_Cy_PlateAsmbly.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_Cy_PlateAsmbly.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_PlateAsmbly.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_PlateAsmbly.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_electric.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_electric.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_electric_cvx.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_electric_cvx.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_muscle.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_muscle.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_simple.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_simple.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_simple_cvx.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_simple_cvx.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_weight.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/forearm_weight.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/knuckle.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/knuckle.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/lfmetacarpal.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/lfmetacarpal.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/palm.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/palm.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/upper_arm.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/upper_arm.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/upper_arm_asmbl_shoulder.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/upper_arm_asmbl_shoulder.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/upper_arm_ass.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/upper_arm_ass.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/wrist.stl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/meshes/wrist.stl


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/tendon_torque_actuation.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/tendon_torque_actuation.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/darkwood.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/darkwood.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/dice.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/dice.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/foil.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/foil.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/marble.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/marble.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/silverRaw.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/silverRaw.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/skin.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/skin.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/square.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/square.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/wood.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/wood.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/woodb.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/dependencies/Adroit/resources/textures/woodb.png


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/__init__.py:
--------------------------------------------------------------------------------
1 | import  mj_envs.hand_manipulation_suite 


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/__init__.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_Adroit.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_Adroit.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_assets.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_assets.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_door.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_door.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_hammer.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_hammer.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_pen.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_pen.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_relocate.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/DAPG_relocate.xml


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/tasks.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/assets/tasks.jpg


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/door_v0.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/door_v0.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/hammer_v0.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/hammer_v0.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/pen_v0.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/pen_v0.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/relocate_v0.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/hand_manipulation_suite/relocate_v0.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/utils/quatmath.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/utils/quatmath.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/mj_envs/utils/visualize_env.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/mj_envs/utils/visualize_env.py


--------------------------------------------------------------------------------
/env_dependencies/mj_envs/setup.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mj_envs/setup.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/LICENSE:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/LICENSE


--------------------------------------------------------------------------------
/env_dependencies/mjrl/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/README.md


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/README.md


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/behavior_clone.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/behavior_clone.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/example_configs/hopper_npg.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/example_configs/hopper_npg.txt


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/example_configs/swimmer_npg.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/example_configs/swimmer_npg.txt


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/example_configs/swimmer_ppo.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/example_configs/swimmer_ppo.txt


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/linear_nn_comparison.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/linear_nn_comparison.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/examples/policy_opt_job_script.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/examples/policy_opt_job_script.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/__init__.py:
--------------------------------------------------------------------------------
1 | import mjrl.envs


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/batch_reinforce.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/batch_reinforce.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/behavior_cloning.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/behavior_cloning.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/dapg.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/dapg.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/mbac.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/mbac.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/model_accel_npg.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/model_accel_npg.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/model_learning_mpc.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/model_learning_mpc.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/nn_dynamics.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/nn_dynamics.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/configs/point_mass.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/configs/point_mass.txt


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/configs/reacher.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/configs/reacher.txt


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/run_model_accel_npg.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/run_model_accel_npg.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/sandbox/example_config_mpc.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/sandbox/example_config_mpc.txt


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/sandbox/run_model_learning_mpc.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/sandbox/run_model_learning_mpc.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/reward_functions/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/reward_functions/mjrl_point_mass.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/reward_functions/mjrl_point_mass.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/visualize_policy.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/visualize_policy.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/visualize_trajectories.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/run_experiments/utils/visualize_trajectories.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/model_accel/sampling.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/model_accel/sampling.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/npg_cg.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/npg_cg.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/ppo_clip.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/ppo_clip.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/algos/trpo.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/algos/trpo.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/baselines/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/baselines/linear_baseline.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/baselines/linear_baseline.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/baselines/mlp_baseline.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/baselines/mlp_baseline.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/baselines/quadratic_baseline.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/baselines/quadratic_baseline.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/baselines/zero_baseline.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/baselines/zero_baseline.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/__init__.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/assets/peg_insertion.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/assets/peg_insertion.xml


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/assets/point_mass.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/assets/point_mass.xml


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/assets/sawyer.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/assets/sawyer.xml


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/assets/swimmer.xml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/assets/swimmer.xml


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/mujoco_env.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/mujoco_env.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/peg_insertion_sawyer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/peg_insertion_sawyer.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/point_mass.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/point_mass.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/reacher_sawyer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/reacher_sawyer.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/envs/swimmer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/envs/swimmer.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/policies/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/policies/gaussian_linear.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/policies/gaussian_linear.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/policies/gaussian_mlp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/policies/gaussian_mlp.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/policies/mpc_actor.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/policies/mpc_actor.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/samplers/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/samplers/core.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/samplers/core.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/cg_solve.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/cg_solve.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/fc_network.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/fc_network.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/get_environment.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/get_environment.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/gym_env.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/gym_env.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/logger.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/logger.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/make_train_plots.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/make_train_plots.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/optimize_model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/optimize_model.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/plot_from_logs.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/plot_from_logs.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/process_samples.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/process_samples.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/tensor_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/tensor_utils.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/train_agent.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/train_agent.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/mjrl/utils/visualize_policy.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/mjrl/utils/visualize_policy.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/setup.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/setup.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/setup/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/setup/README.md


--------------------------------------------------------------------------------
/env_dependencies/mjrl/setup/env.yml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/setup/env.yml


--------------------------------------------------------------------------------
/env_dependencies/mjrl/tests/hydra/config/hydra_npg_config.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/tests/hydra/config/hydra_npg_config.yaml


--------------------------------------------------------------------------------
/env_dependencies/mjrl/tests/hydra/hydra_policy_opt_job_script.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/tests/hydra/hydra_policy_opt_job_script.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/tests/point_mass_test.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/tests/point_mass_test.py


--------------------------------------------------------------------------------
/env_dependencies/mjrl/tests/visualizer_test.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/env_dependencies/mjrl/tests/visualizer_test.py


--------------------------------------------------------------------------------
/scripts/run/codec_model/vqgan_adroit.sh:
--------------------------------------------------------------------------------
1 | python scripts/train_vqgan.py dataset=adroit


--------------------------------------------------------------------------------
/scripts/run/codec_model/vqgan_metaworld.sh:
--------------------------------------------------------------------------------
1 | python scripts/train_vqgan.py dataset=metaworld


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_adroit_amp.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_adroit_amp.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_adroit_diffusion_reward.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_adroit_diffusion_reward.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_adroit_raw_sparse_reward.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_adroit_raw_sparse_reward.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_adroit_rnd.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_adroit_rnd.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_adroit_viper.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_adroit_viper.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_adroit_viper_std.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_adroit_viper_std.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_metaworld_amp.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_metaworld_amp.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_metaworld_diffusion_reward.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_metaworld_diffusion_reward.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_metaworld_raw_sparse_reward.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_metaworld_raw_sparse_reward.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_metaworld_rnd.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_metaworld_rnd.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_metaworld_viper.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_metaworld_viper.sh


--------------------------------------------------------------------------------
/scripts/run/rl/drqv2_metaworld_viper_std.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/run/rl/drqv2_metaworld_viper_std.sh


--------------------------------------------------------------------------------
/scripts/run/video_model/videogpt_adroit.sh:
--------------------------------------------------------------------------------
1 | python scripts/train_videogpt.py dataset=adroit


--------------------------------------------------------------------------------
/scripts/run/video_model/videogpt_metaworld.sh:
--------------------------------------------------------------------------------
1 | python scripts/train_videogpt.py dataset=metaworld


--------------------------------------------------------------------------------
/scripts/run/video_model/vqdiffusion_adroit.sh:
--------------------------------------------------------------------------------
1 | python scripts/train_vqdiffusion.py dataset=adroit


--------------------------------------------------------------------------------
/scripts/run/video_model/vqdiffusion_metaworld.sh:
--------------------------------------------------------------------------------
1 | python scripts/train_vqdiffusion.py dataset=metaworld


--------------------------------------------------------------------------------
/scripts/train_drqv2.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/train_drqv2.py


--------------------------------------------------------------------------------
/scripts/train_videogpt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/train_videogpt.py


--------------------------------------------------------------------------------
/scripts/train_vqdiffusion.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/train_vqdiffusion.py


--------------------------------------------------------------------------------
/scripts/train_vqgan.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/scripts/train_vqgan.py


--------------------------------------------------------------------------------
/setup.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/TEA-Lab/diffusion_reward/HEAD/setup.py


--------------------------------------------------------------------------------