├── .gitignore
├── LICENSE
├── README.md
├── assets
    └── video3dllm.png
├── llava
    ├── __init__.py
    ├── constants.py
    ├── conversation.py
    ├── eval
    │   ├── box_utils.py
    │   ├── caption_eval
    │   │   ├── __init__.py
    │   │   ├── bleu
    │   │   │   ├── __init__.py
    │   │   │   ├── bleu.py
    │   │   │   └── bleu_scorer.py
    │   │   ├── cider
    │   │   │   ├── __init__.py
    │   │   │   ├── cider.py
    │   │   │   └── cider_scorer.py
    │   │   ├── meteor
    │   │   │   ├── __init__.py
    │   │   │   ├── data
    │   │   │   │   └── paraphrase-en.gz
    │   │   │   ├── meteor-1.5.jar
    │   │   │   └── meteor.py
    │   │   ├── readme.txt
    │   │   ├── refEvaluation.py
    │   │   ├── rouge
    │   │   │   ├── __init__.py
    │   │   │   └── rouge.py
    │   │   └── tokenizer
    │   │   │   ├── __init__.py
    │   │   │   ├── ptbtokenizer.py
    │   │   │   └── stanford-corenlp-3.4.1.jar
    │   ├── eval_multi3drefer.py
    │   ├── eval_nr3d.py
    │   ├── eval_scan2cap.py
    │   ├── eval_scanqa.py
    │   ├── eval_scanrefer.py
    │   ├── eval_sqa3d.py
    │   ├── evaluate_interleave.py
    │   ├── model_multi3drefer.py
    │   ├── model_scan2cap.py
    │   ├── model_scanqa.py
    │   ├── model_scanrefer.py
    │   ├── model_sqa3d.py
    │   └── model_vqa.py
    ├── mm_utils.py
    ├── model
    │   ├── __init__.py
    │   ├── apply_delta.py
    │   ├── builder.py
    │   ├── consolidate.py
    │   ├── language_model
    │   │   ├── llava_gemma.py
    │   │   ├── llava_llama.py
    │   │   ├── llava_mistral.py
    │   │   ├── llava_mixtral.py
    │   │   ├── llava_mpt.py
    │   │   ├── llava_qwen.py
    │   │   ├── llava_qwen_moe.py
    │   │   ├── modeling_llama.py
    │   │   └── qwen2
    │   │   │   └── modeling_qwen2.py
    │   ├── llava_arch.py
    │   ├── make_delta.py
    │   ├── multimodal_encoder
    │   │   ├── builder.py
    │   │   ├── clip_encoder.py
    │   │   ├── dev_eva_clip
    │   │   │   ├── eva_clip
    │   │   │   │   ├── __init__.py
    │   │   │   │   ├── bpe_simple_vocab_16e6.txt.gz
    │   │   │   │   ├── constants.py
    │   │   │   │   ├── eva_vit_model.py
    │   │   │   │   ├── factory.py
    │   │   │   │   ├── hf_configs.py
    │   │   │   │   ├── hf_model.py
    │   │   │   │   ├── loss.py
    │   │   │   │   ├── model.py
    │   │   │   │   ├── model_configs
    │   │   │   │   │   ├── EVA-CLIP-18B.json
    │   │   │   │   │   ├── EVA-CLIP-8B-plus.json
    │   │   │   │   │   ├── EVA-CLIP-8B.json
    │   │   │   │   │   ├── EVA01-CLIP-B-16.json
    │   │   │   │   │   ├── EVA01-CLIP-g-14-plus.json
    │   │   │   │   │   ├── EVA01-CLIP-g-14.json
    │   │   │   │   │   ├── EVA02-CLIP-B-16.json
    │   │   │   │   │   ├── EVA02-CLIP-L-14-336.json
    │   │   │   │   │   ├── EVA02-CLIP-L-14.json
    │   │   │   │   │   ├── EVA02-CLIP-bigE-14-plus.json
    │   │   │   │   │   ├── EVA02-CLIP-bigE-14.json
    │   │   │   │   │   ├── Internal-EVA02-CLIP-10B-14-448.json
    │   │   │   │   │   └── Internal-EVA02-CLIP-10B-14.json
    │   │   │   │   ├── modified_resnet.py
    │   │   │   │   ├── openai.py
    │   │   │   │   ├── pretrained.py
    │   │   │   │   ├── rope.py
    │   │   │   │   ├── timm_model.py
    │   │   │   │   ├── tokenizer.py
    │   │   │   │   ├── transform.py
    │   │   │   │   ├── transformer.py
    │   │   │   │   └── utils.py
    │   │   │   └── eva_vit.py
    │   │   ├── eva_clip
    │   │   │   ├── eva_clip_encoder.py
    │   │   │   ├── eva_clip_processors.py
    │   │   │   ├── eva_vit.py
    │   │   │   ├── factory.py
    │   │   │   └── model_configs
    │   │   │   │   ├── EVA-CLIP-18B.json
    │   │   │   │   ├── EVA-CLIP-8B-plus.json
    │   │   │   │   ├── EVA-CLIP-8B.json
    │   │   │   │   ├── EVA01-CLIP-B-16.json
    │   │   │   │   ├── EVA01-CLIP-g-14-plus.json
    │   │   │   │   ├── EVA01-CLIP-g-14.json
    │   │   │   │   ├── EVA02-CLIP-B-16.json
    │   │   │   │   ├── EVA02-CLIP-L-14-336.json
    │   │   │   │   ├── EVA02-CLIP-L-14.json
    │   │   │   │   ├── EVA02-CLIP-bigE-14-plus.json
    │   │   │   │   ├── EVA02-CLIP-bigE-14.json
    │   │   │   │   ├── Internal-EVA02-CLIP-10B-14-448.json
    │   │   │   │   └── Internal-EVA02-CLIP-10B-14.json
    │   │   ├── hf_vision.py
    │   │   ├── imagebind.py
    │   │   ├── open_clip_encoder.py
    │   │   └── siglip_encoder.py
    │   ├── multimodal_projector
    │   │   ├── builder.py
    │   │   └── pooler_projector.py
    │   ├── multimodal_resampler
    │   │   ├── builder.py
    │   │   ├── masked_drop.py
    │   │   ├── perceiver.py
    │   │   ├── qformer.py
    │   │   └── spatial_pool.py
    │   ├── position_encoding.py
    │   └── utils.py
    ├── serve
    │   ├── __init__.py
    │   ├── cli.py
    │   ├── controller.py
    │   ├── examples
    │   │   ├── extreme_ironing.jpg
    │   │   └── waterview.jpg
    │   ├── gradio_multi_image.py
    │   ├── gradio_web_server.py
    │   ├── model_worker.py
    │   ├── register_worker.py
    │   ├── sglang_worker.py
    │   └── test_message.py
    ├── train
    │   ├── llama_flash_attn_monkey_patch.py
    │   ├── llava_trainer.py
    │   ├── llava_trainer_eval.py
    │   ├── train.py
    │   ├── train_3d.py
    │   ├── train_dpo.py
    │   └── train_mem.py
    ├── utils.py
    ├── utils_3d.py
    └── video_utils.py
├── pyproject.toml
├── scripts
    ├── 3d
    │   ├── eval
    │   │   ├── eval_multi3drefer.sh
    │   │   ├── eval_scan2cap.sh
    │   │   ├── eval_scan2cap_lora.sh
    │   │   ├── eval_scanqa.sh
    │   │   ├── eval_scanrefer.sh
    │   │   └── eval_sqa3d.sh
    │   ├── preprocessing
    │   │   ├── README.md
    │   │   ├── convert_pcd_to_voxel.py
    │   │   ├── extract_gt_box.py
    │   │   ├── extract_pred_box.py
    │   │   ├── extract_scannet_pcd.py
    │   │   ├── generate_image_scannet.py
    │   │   ├── max_coverage_sampling.py
    │   │   ├── process_multi3drefer.py
    │   │   ├── process_scan2cap.py
    │   │   ├── process_scanqa.py
    │   │   ├── process_scanrefer.py
    │   │   ├── process_sqa3d.py
    │   │   └── scannet_metadata
    │   │   │   ├── scannetv2-labels.combined.tsv
    │   │   │   ├── scannetv2_test.txt
    │   │   │   ├── scannetv2_train.txt
    │   │   │   └── scannetv2_val.txt
    │   └── train
    │   │   ├── multi.yaml
    │   │   └── train_multi.sh
    ├── zero2.json
    ├── zero2_fused_adamw.json
    ├── zero2_offload.json
    ├── zero3.json
    ├── zero3_offload.json
    └── zero3pp.json
└── trl
    ├── __init__.py
    ├── core.py
    ├── environment
        ├── __init__.py
        └── base_environment.py
    ├── extras
        ├── __init__.py
        ├── best_of_n_sampler.py
        └── dataset_formatting.py
    ├── import_utils.py
    ├── models
        ├── __init__.py
        ├── modeling_base.py
        ├── modeling_sd_base.py
        ├── modeling_value_head.py
        └── utils.py
    └── trainer
        ├── __init__.py
        ├── base.py
        ├── ddpo_config.py
        ├── ddpo_trainer.py
        ├── dpo_trainer.py
        ├── iterative_sft_trainer.py
        ├── model_config.py
        ├── ppo_config.py
        ├── ppo_trainer.py
        ├── reward_config.py
        ├── reward_trainer.py
        ├── sft_trainer.py
        └── utils.py


/.gitignore:
--------------------------------------------------------------------------------
1 | *__pycache__*


--------------------------------------------------------------------------------
/LICENSE:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/LICENSE


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/README.md


--------------------------------------------------------------------------------
/assets/video3dllm.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/assets/video3dllm.png


--------------------------------------------------------------------------------
/llava/__init__.py:
--------------------------------------------------------------------------------
1 | from .model import LlavaLlamaForCausalLM
2 | 


--------------------------------------------------------------------------------
/llava/constants.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/constants.py


--------------------------------------------------------------------------------
/llava/conversation.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/conversation.py


--------------------------------------------------------------------------------
/llava/eval/box_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/box_utils.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/__init__.py:
--------------------------------------------------------------------------------
1 | __author__ = 'licheng'
2 | 
3 | 
4 | 


--------------------------------------------------------------------------------
/llava/eval/caption_eval/bleu/__init__.py:
--------------------------------------------------------------------------------
1 | __author__ = 'tylin'
2 | 


--------------------------------------------------------------------------------
/llava/eval/caption_eval/bleu/bleu.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/bleu/bleu.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/bleu/bleu_scorer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/bleu/bleu_scorer.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/cider/__init__.py:
--------------------------------------------------------------------------------
1 | __author__ = 'tylin'
2 | 


--------------------------------------------------------------------------------
/llava/eval/caption_eval/cider/cider.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/cider/cider.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/cider/cider_scorer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/cider/cider_scorer.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/meteor/__init__.py:
--------------------------------------------------------------------------------
1 | __author__ = 'tylin'
2 | 


--------------------------------------------------------------------------------
/llava/eval/caption_eval/meteor/data/paraphrase-en.gz:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/meteor/data/paraphrase-en.gz


--------------------------------------------------------------------------------
/llava/eval/caption_eval/meteor/meteor-1.5.jar:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/meteor/meteor-1.5.jar


--------------------------------------------------------------------------------
/llava/eval/caption_eval/meteor/meteor.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/meteor/meteor.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/readme.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/readme.txt


--------------------------------------------------------------------------------
/llava/eval/caption_eval/refEvaluation.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/refEvaluation.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/rouge/__init__.py:
--------------------------------------------------------------------------------
1 | __author__ = 'vrama91'
2 | 


--------------------------------------------------------------------------------
/llava/eval/caption_eval/rouge/rouge.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/rouge/rouge.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/tokenizer/__init__.py:
--------------------------------------------------------------------------------
1 | __author__ = 'hfang'
2 | 


--------------------------------------------------------------------------------
/llava/eval/caption_eval/tokenizer/ptbtokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/tokenizer/ptbtokenizer.py


--------------------------------------------------------------------------------
/llava/eval/caption_eval/tokenizer/stanford-corenlp-3.4.1.jar:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/caption_eval/tokenizer/stanford-corenlp-3.4.1.jar


--------------------------------------------------------------------------------
/llava/eval/eval_multi3drefer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/eval_multi3drefer.py


--------------------------------------------------------------------------------
/llava/eval/eval_nr3d.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/eval_nr3d.py


--------------------------------------------------------------------------------
/llava/eval/eval_scan2cap.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/eval_scan2cap.py


--------------------------------------------------------------------------------
/llava/eval/eval_scanqa.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/eval_scanqa.py


--------------------------------------------------------------------------------
/llava/eval/eval_scanrefer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/eval_scanrefer.py


--------------------------------------------------------------------------------
/llava/eval/eval_sqa3d.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/eval_sqa3d.py


--------------------------------------------------------------------------------
/llava/eval/evaluate_interleave.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/evaluate_interleave.py


--------------------------------------------------------------------------------
/llava/eval/model_multi3drefer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/model_multi3drefer.py


--------------------------------------------------------------------------------
/llava/eval/model_scan2cap.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/model_scan2cap.py


--------------------------------------------------------------------------------
/llava/eval/model_scanqa.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/model_scanqa.py


--------------------------------------------------------------------------------
/llava/eval/model_scanrefer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/model_scanrefer.py


--------------------------------------------------------------------------------
/llava/eval/model_sqa3d.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/model_sqa3d.py


--------------------------------------------------------------------------------
/llava/eval/model_vqa.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/eval/model_vqa.py


--------------------------------------------------------------------------------
/llava/mm_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/mm_utils.py


--------------------------------------------------------------------------------
/llava/model/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/__init__.py


--------------------------------------------------------------------------------
/llava/model/apply_delta.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/apply_delta.py


--------------------------------------------------------------------------------
/llava/model/builder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/builder.py


--------------------------------------------------------------------------------
/llava/model/consolidate.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/consolidate.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_gemma.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_gemma.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_llama.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_llama.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_mistral.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_mistral.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_mixtral.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_mixtral.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_mpt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_mpt.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_qwen.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_qwen.py


--------------------------------------------------------------------------------
/llava/model/language_model/llava_qwen_moe.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/llava_qwen_moe.py


--------------------------------------------------------------------------------
/llava/model/language_model/modeling_llama.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/modeling_llama.py


--------------------------------------------------------------------------------
/llava/model/language_model/qwen2/modeling_qwen2.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/language_model/qwen2/modeling_qwen2.py


--------------------------------------------------------------------------------
/llava/model/llava_arch.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/llava_arch.py


--------------------------------------------------------------------------------
/llava/model/make_delta.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/make_delta.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/builder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/builder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/clip_encoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/clip_encoder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/__init__.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/bpe_simple_vocab_16e6.txt.gz:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/bpe_simple_vocab_16e6.txt.gz


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/constants.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/constants.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/eva_vit_model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/eva_vit_model.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/factory.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/factory.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/hf_configs.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/hf_configs.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/hf_model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/hf_model.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/loss.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/loss.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA-CLIP-18B.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA-CLIP-18B.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA-CLIP-8B-plus.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA-CLIP-8B-plus.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA-CLIP-8B.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA-CLIP-8B.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA01-CLIP-B-16.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA01-CLIP-B-16.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA01-CLIP-g-14-plus.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA01-CLIP-g-14-plus.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA01-CLIP-g-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA01-CLIP-g-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-B-16.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-B-16.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-L-14-336.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-L-14-336.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-L-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-L-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-bigE-14-plus.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-bigE-14-plus.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-bigE-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/EVA02-CLIP-bigE-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14-448.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14-448.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/modified_resnet.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/modified_resnet.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/openai.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/openai.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/pretrained.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/pretrained.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/rope.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/rope.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/timm_model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/timm_model.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/tokenizer.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/transform.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/transform.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/transformer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/transformer.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_clip/utils.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/dev_eva_clip/eva_vit.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/dev_eva_clip/eva_vit.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/eva_clip_encoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/eva_clip_encoder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/eva_clip_processors.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/eva_clip_processors.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/eva_vit.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/eva_vit.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/factory.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/factory.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA-CLIP-18B.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA-CLIP-18B.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA-CLIP-8B-plus.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA-CLIP-8B-plus.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA-CLIP-8B.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA-CLIP-8B.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA01-CLIP-B-16.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA01-CLIP-B-16.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA01-CLIP-g-14-plus.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA01-CLIP-g-14-plus.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA01-CLIP-g-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA01-CLIP-g-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-B-16.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-B-16.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-L-14-336.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-L-14-336.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-L-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-L-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-bigE-14-plus.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-bigE-14-plus.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-bigE-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/EVA02-CLIP-bigE-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14-448.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14-448.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/eva_clip/model_configs/Internal-EVA02-CLIP-10B-14.json


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/hf_vision.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/hf_vision.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/imagebind.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/imagebind.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/open_clip_encoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/open_clip_encoder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_encoder/siglip_encoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_encoder/siglip_encoder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_projector/builder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_projector/builder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_projector/pooler_projector.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_projector/pooler_projector.py


--------------------------------------------------------------------------------
/llava/model/multimodal_resampler/builder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_resampler/builder.py


--------------------------------------------------------------------------------
/llava/model/multimodal_resampler/masked_drop.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_resampler/masked_drop.py


--------------------------------------------------------------------------------
/llava/model/multimodal_resampler/perceiver.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_resampler/perceiver.py


--------------------------------------------------------------------------------
/llava/model/multimodal_resampler/qformer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_resampler/qformer.py


--------------------------------------------------------------------------------
/llava/model/multimodal_resampler/spatial_pool.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/multimodal_resampler/spatial_pool.py


--------------------------------------------------------------------------------
/llava/model/position_encoding.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/position_encoding.py


--------------------------------------------------------------------------------
/llava/model/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/model/utils.py


--------------------------------------------------------------------------------
/llava/serve/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/llava/serve/cli.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/cli.py


--------------------------------------------------------------------------------
/llava/serve/controller.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/controller.py


--------------------------------------------------------------------------------
/llava/serve/examples/extreme_ironing.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/examples/extreme_ironing.jpg


--------------------------------------------------------------------------------
/llava/serve/examples/waterview.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/examples/waterview.jpg


--------------------------------------------------------------------------------
/llava/serve/gradio_multi_image.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/gradio_multi_image.py


--------------------------------------------------------------------------------
/llava/serve/gradio_web_server.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/gradio_web_server.py


--------------------------------------------------------------------------------
/llava/serve/model_worker.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/model_worker.py


--------------------------------------------------------------------------------
/llava/serve/register_worker.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/register_worker.py


--------------------------------------------------------------------------------
/llava/serve/sglang_worker.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/sglang_worker.py


--------------------------------------------------------------------------------
/llava/serve/test_message.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/serve/test_message.py


--------------------------------------------------------------------------------
/llava/train/llama_flash_attn_monkey_patch.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/llama_flash_attn_monkey_patch.py


--------------------------------------------------------------------------------
/llava/train/llava_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/llava_trainer.py


--------------------------------------------------------------------------------
/llava/train/llava_trainer_eval.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/llava_trainer_eval.py


--------------------------------------------------------------------------------
/llava/train/train.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/train.py


--------------------------------------------------------------------------------
/llava/train/train_3d.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/train_3d.py


--------------------------------------------------------------------------------
/llava/train/train_dpo.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/train_dpo.py


--------------------------------------------------------------------------------
/llava/train/train_mem.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/train/train_mem.py


--------------------------------------------------------------------------------
/llava/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/utils.py


--------------------------------------------------------------------------------
/llava/utils_3d.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/utils_3d.py


--------------------------------------------------------------------------------
/llava/video_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/llava/video_utils.py


--------------------------------------------------------------------------------
/pyproject.toml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/pyproject.toml


--------------------------------------------------------------------------------
/scripts/3d/eval/eval_multi3drefer.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/eval/eval_multi3drefer.sh


--------------------------------------------------------------------------------
/scripts/3d/eval/eval_scan2cap.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/eval/eval_scan2cap.sh


--------------------------------------------------------------------------------
/scripts/3d/eval/eval_scan2cap_lora.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/eval/eval_scan2cap_lora.sh


--------------------------------------------------------------------------------
/scripts/3d/eval/eval_scanqa.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/eval/eval_scanqa.sh


--------------------------------------------------------------------------------
/scripts/3d/eval/eval_scanrefer.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/eval/eval_scanrefer.sh


--------------------------------------------------------------------------------
/scripts/3d/eval/eval_sqa3d.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/eval/eval_sqa3d.sh


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/README.md


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/convert_pcd_to_voxel.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/convert_pcd_to_voxel.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/extract_gt_box.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/extract_gt_box.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/extract_pred_box.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/extract_pred_box.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/extract_scannet_pcd.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/extract_scannet_pcd.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/generate_image_scannet.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/generate_image_scannet.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/max_coverage_sampling.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/max_coverage_sampling.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/process_multi3drefer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/process_multi3drefer.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/process_scan2cap.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/process_scan2cap.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/process_scanqa.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/process_scanqa.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/process_scanrefer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/process_scanrefer.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/process_sqa3d.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/process_sqa3d.py


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/scannet_metadata/scannetv2-labels.combined.tsv:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/scannet_metadata/scannetv2-labels.combined.tsv


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/scannet_metadata/scannetv2_test.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/scannet_metadata/scannetv2_test.txt


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/scannet_metadata/scannetv2_train.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/scannet_metadata/scannetv2_train.txt


--------------------------------------------------------------------------------
/scripts/3d/preprocessing/scannet_metadata/scannetv2_val.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/preprocessing/scannet_metadata/scannetv2_val.txt


--------------------------------------------------------------------------------
/scripts/3d/train/multi.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/train/multi.yaml


--------------------------------------------------------------------------------
/scripts/3d/train/train_multi.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/3d/train/train_multi.sh


--------------------------------------------------------------------------------
/scripts/zero2.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/zero2.json


--------------------------------------------------------------------------------
/scripts/zero2_fused_adamw.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/zero2_fused_adamw.json


--------------------------------------------------------------------------------
/scripts/zero2_offload.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/zero2_offload.json


--------------------------------------------------------------------------------
/scripts/zero3.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/zero3.json


--------------------------------------------------------------------------------
/scripts/zero3_offload.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/zero3_offload.json


--------------------------------------------------------------------------------
/scripts/zero3pp.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/scripts/zero3pp.json


--------------------------------------------------------------------------------
/trl/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/__init__.py


--------------------------------------------------------------------------------
/trl/core.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/core.py


--------------------------------------------------------------------------------
/trl/environment/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/environment/__init__.py


--------------------------------------------------------------------------------
/trl/environment/base_environment.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/environment/base_environment.py


--------------------------------------------------------------------------------
/trl/extras/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/extras/__init__.py


--------------------------------------------------------------------------------
/trl/extras/best_of_n_sampler.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/extras/best_of_n_sampler.py


--------------------------------------------------------------------------------
/trl/extras/dataset_formatting.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/extras/dataset_formatting.py


--------------------------------------------------------------------------------
/trl/import_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/import_utils.py


--------------------------------------------------------------------------------
/trl/models/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/models/__init__.py


--------------------------------------------------------------------------------
/trl/models/modeling_base.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/models/modeling_base.py


--------------------------------------------------------------------------------
/trl/models/modeling_sd_base.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/models/modeling_sd_base.py


--------------------------------------------------------------------------------
/trl/models/modeling_value_head.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/models/modeling_value_head.py


--------------------------------------------------------------------------------
/trl/models/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/models/utils.py


--------------------------------------------------------------------------------
/trl/trainer/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/__init__.py


--------------------------------------------------------------------------------
/trl/trainer/base.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/base.py


--------------------------------------------------------------------------------
/trl/trainer/ddpo_config.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/ddpo_config.py


--------------------------------------------------------------------------------
/trl/trainer/ddpo_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/ddpo_trainer.py


--------------------------------------------------------------------------------
/trl/trainer/dpo_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/dpo_trainer.py


--------------------------------------------------------------------------------
/trl/trainer/iterative_sft_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/iterative_sft_trainer.py


--------------------------------------------------------------------------------
/trl/trainer/model_config.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/model_config.py


--------------------------------------------------------------------------------
/trl/trainer/ppo_config.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/ppo_config.py


--------------------------------------------------------------------------------
/trl/trainer/ppo_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/ppo_trainer.py


--------------------------------------------------------------------------------
/trl/trainer/reward_config.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/reward_config.py


--------------------------------------------------------------------------------
/trl/trainer/reward_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/reward_trainer.py


--------------------------------------------------------------------------------
/trl/trainer/sft_trainer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/sft_trainer.py


--------------------------------------------------------------------------------
/trl/trainer/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/LaVi-Lab/Video-3D-LLM/HEAD/trl/trainer/utils.py


--------------------------------------------------------------------------------