├── .gitignore
├── assets
    └── logo.png
├── docs
    ├── dataset.md
    ├── quick_use.md
    └── training.md
├── egs
    └── pretraining
    │   ├── data_scripts
    │       ├── create_data_json.py
    │       ├── emilia
    │       │   ├── config.json
    │       │   ├── env.sh
    │       │   ├── main.py
    │       │   ├── models
    │       │   │   ├── __init__.py
    │       │   │   ├── dnsmos.py
    │       │   │   ├── separate_fast.py
    │       │   │   ├── silero_vad.py
    │       │   │   ├── speaker_diarization.py
    │       │   │   └── whisper_asr.py
    │       │   ├── requirements.txt
    │       │   └── utils
    │       │   │   ├── __init__.py
    │       │   │   ├── logger.py
    │       │   │   └── tool.py
    │       ├── filter_scp.py
    │       ├── offline_codec_tokenization.py
    │       ├── offline_tokenization_scp.py
    │       ├── offline_tokenization_tar.py
    │       ├── read_text.py
    │       ├── text_tokenization.py
    │       ├── text_tokenization_reverse.py
    │       ├── text_tokenization_scp.py
    │       └── text_tokenization_utt2json.py
    │   ├── down.sh
    │   ├── infer.sh
    │   ├── local
    │       ├── asr_whisperx.py
    │       ├── asr_whisperx_tar.py
    │       └── vad_segment.py
    │   ├── log
    │       ├── text_token_reverse.1.log
    │       ├── text_token_reverse.10.log
    │       ├── text_token_reverse.11.log
    │       ├── text_token_reverse.12.log
    │       ├── text_token_reverse.13.log
    │       ├── text_token_reverse.14.log
    │       ├── text_token_reverse.15.log
    │       ├── text_token_reverse.16.log
    │       ├── text_token_reverse.17.log
    │       ├── text_token_reverse.18.log
    │       ├── text_token_reverse.19.log
    │       ├── text_token_reverse.2.log
    │       ├── text_token_reverse.20.log
    │       ├── text_token_reverse.21.log
    │       ├── text_token_reverse.22.log
    │       ├── text_token_reverse.23.log
    │       ├── text_token_reverse.24.log
    │       ├── text_token_reverse.25.log
    │       ├── text_token_reverse.26.log
    │       ├── text_token_reverse.27.log
    │       ├── text_token_reverse.28.log
    │       ├── text_token_reverse.29.log
    │       ├── text_token_reverse.3.log
    │       ├── text_token_reverse.30.log
    │       ├── text_token_reverse.31.log
    │       ├── text_token_reverse.32.log
    │       ├── text_token_reverse.33.log
    │       ├── text_token_reverse.34.log
    │       ├── text_token_reverse.35.log
    │       ├── text_token_reverse.36.log
    │       ├── text_token_reverse.37.log
    │       ├── text_token_reverse.38.log
    │       ├── text_token_reverse.39.log
    │       ├── text_token_reverse.4.log
    │       ├── text_token_reverse.40.log
    │       ├── text_token_reverse.41.log
    │       ├── text_token_reverse.42.log
    │       ├── text_token_reverse.43.log
    │       ├── text_token_reverse.44.log
    │       ├── text_token_reverse.45.log
    │       ├── text_token_reverse.46.log
    │       ├── text_token_reverse.47.log
    │       ├── text_token_reverse.48.log
    │       ├── text_token_reverse.49.log
    │       ├── text_token_reverse.5.log
    │       ├── text_token_reverse.50.log
    │       ├── text_token_reverse.51.log
    │       ├── text_token_reverse.52.log
    │       ├── text_token_reverse.53.log
    │       ├── text_token_reverse.54.log
    │       ├── text_token_reverse.55.log
    │       ├── text_token_reverse.56.log
    │       ├── text_token_reverse.57.log
    │       ├── text_token_reverse.58.log
    │       ├── text_token_reverse.59.log
    │       ├── text_token_reverse.6.log
    │       ├── text_token_reverse.60.log
    │       ├── text_token_reverse.61.log
    │       ├── text_token_reverse.62.log
    │       ├── text_token_reverse.63.log
    │       ├── text_token_reverse.64.log
    │       ├── text_token_reverse.7.log
    │       ├── text_token_reverse.8.log
    │       └── text_token_reverse.9.log
    │   ├── path.sh
    │   ├── podcast_output.wav
    │   ├── prepare_broadcast_data.sh
    │   ├── prepare_hf_tts_data.sh
    │   ├── readme.md
    │   ├── run.sh
    │   ├── test1_en.wav
    │   └── utils
    │       ├── run.pl
    │       └── split_scp.pl
├── inference
    ├── generator.py
    ├── generator_pod.py
    └── generator_pod_cn.py
├── llama3_2
    ├── config.json
    ├── special_tokens_map.json
    ├── tokenizer.json
    └── tokenizer_config.json
├── models
    ├── __init__.py
    ├── __pycache__
    │   ├── __init__.cpython-310.pyc
    │   └── model_new.cpython-310.pyc
    └── model_new.py
├── readme.md
├── tools
    ├── data_scripts
    │   ├── create_data_json.py
    │   ├── filter_scp.py
    │   ├── find_peer_utts.py
    │   ├── merge_then_split.py
    │   ├── offline_tokenization.py
    │   └── select_spk2utt.py
    ├── kaldi
    │   └── utils
    │   │   ├── add_disambig.pl
    │   │   ├── add_lex_disambig.pl
    │   │   ├── analyze_segments.pl
    │   │   ├── apply_map.pl
    │   │   ├── best_wer.sh
    │   │   ├── build_const_arpa_lm.sh
    │   │   ├── build_kenlm_model_from_arpa.sh
    │   │   ├── combine_data.sh
    │   │   ├── convert_ctm.pl
    │   │   ├── convert_slf.pl
    │   │   ├── convert_slf_parallel.sh
    │   │   ├── copy_data_dir.sh
    │   │   ├── create_data_link.pl
    │   │   ├── create_split_dir.pl
    │   │   ├── ctm
    │   │       ├── convert_ctm.pl
    │   │       ├── fix_ctm.sh
    │   │       └── resolve_ctm_overlaps.py
    │   │   ├── data
    │   │       ├── combine_data.sh
    │   │       ├── combine_short_segments.sh
    │   │       ├── convert_data_dir_to_whole.sh
    │   │       ├── copy_data_dir.sh
    │   │       ├── extend_segment_times.py
    │   │       ├── extract_wav_segments_data_dir.sh
    │   │       ├── fix_data_dir.sh
    │   │       ├── fix_subsegment_feats.pl
    │   │       ├── get_allowed_durations.py
    │   │       ├── get_frame_shift.sh
    │   │       ├── get_num_frames.sh
    │   │       ├── get_reco2dur.sh
    │   │       ├── get_reco2utt_for_data.sh
    │   │       ├── get_segments_for_data.sh
    │   │       ├── get_uniform_subsegments.py
    │   │       ├── get_utt2dur.sh
    │   │       ├── get_utt2num_frames.sh
    │   │       ├── internal
    │   │       │   ├── choose_utts_to_combine.py
    │   │       │   ├── combine_segments_to_recording.py
    │   │       │   ├── modify_speaker_info.py
    │   │       │   └── perturb_volume.py
    │   │       ├── limit_feature_dim.sh
    │   │       ├── modify_speaker_info.sh
    │   │       ├── modify_speaker_info_to_recording.sh
    │   │       ├── normalize_data_range.pl
    │   │       ├── perturb_data_dir_speed.sh
    │   │       ├── perturb_data_dir_speed_3way.sh
    │   │       ├── perturb_data_dir_volume.sh
    │   │       ├── perturb_speed_to_allowed_lengths.py
    │   │       ├── remove_dup_utts.sh
    │   │       ├── resample_data_dir.sh
    │   │       ├── shift_and_combine_feats.sh
    │   │       ├── shift_feats.sh
    │   │       ├── split_data.sh
    │   │       ├── subsegment_data_dir.sh
    │   │       ├── subset_data_dir.sh
    │   │       └── validate_data_dir.sh
    │   │   ├── dict_dir_add_pronprobs.sh
    │   │   ├── eps2disambig.pl
    │   │   ├── filt.py
    │   │   ├── filter_scp.pl
    │   │   ├── filter_scps.pl
    │   │   ├── find_arpa_oovs.pl
    │   │   ├── fix_ctm.sh
    │   │   ├── fix_data_dir.sh
    │   │   ├── format_lm.sh
    │   │   ├── format_lm_sri.sh
    │   │   ├── gen_topo.pl
    │   │   ├── int2sym.pl
    │   │   ├── kwslist_post_process.pl
    │   │   ├── lang
    │   │       ├── add_lex_disambig.pl
    │   │       ├── add_unigrams_arpa.pl
    │   │       ├── adjust_unk_arpa.pl
    │   │       ├── adjust_unk_graph.sh
    │   │       ├── bpe
    │   │       │   ├── add_final_optional_silence.sh
    │   │       │   ├── apply_bpe.py
    │   │       │   ├── bidi.py
    │   │       │   ├── learn_bpe.py
    │   │       │   ├── prepend_words.py
    │   │       │   └── reverse.py
    │   │       ├── check_g_properties.pl
    │   │       ├── check_phones_compatible.sh
    │   │       ├── compute_sentence_probs_arpa.py
    │   │       ├── extend_lang.sh
    │   │       ├── get_word_position_phone_map.pl
    │   │       ├── grammar
    │   │       │   ├── augment_phones_txt.py
    │   │       │   └── augment_words_txt.py
    │   │       ├── internal
    │   │       │   ├── apply_unk_lm.sh
    │   │       │   ├── arpa2fst_constrained.py
    │   │       │   └── modify_unk_pron.py
    │   │       ├── limit_arpa_unk_history.py
    │   │       ├── make_kn_lm.py
    │   │       ├── make_lexicon_fst.py
    │   │       ├── make_lexicon_fst_silprob.py
    │   │       ├── make_phone_bigram_lang.sh
    │   │       ├── make_phone_lm.py
    │   │       ├── make_position_dependent_subword_lexicon.py
    │   │       ├── make_subword_lexicon_fst.py
    │   │       ├── make_unk_lm.sh
    │   │       ├── ngram_entropy_pruning.py
    │   │       ├── prepare_lang.sh
    │   │       ├── validate_disambig_sym_file.pl
    │   │       └── validate_lang.pl
    │   │   ├── ln.pl
    │   │   ├── make_absolute.sh
    │   │   ├── make_lexicon_fst.pl
    │   │   ├── make_lexicon_fst_silprob.pl
    │   │   ├── make_unigram_grammar.pl
    │   │   ├── map_arpa_lm.pl
    │   │   ├── mkgraph.sh
    │   │   ├── mkgraph_lookahead.sh
    │   │   ├── nnet-cpu
    │   │       ├── make_nnet_config.pl
    │   │       ├── make_nnet_config_block.pl
    │   │       ├── make_nnet_config_preconditioned.pl
    │   │       └── update_learning_rates.pl
    │   │   ├── nnet
    │   │       ├── gen_dct_mat.py
    │   │       ├── gen_hamm_mat.py
    │   │       ├── gen_splice.py
    │   │       ├── make_blstm_proto.py
    │   │       ├── make_cnn_proto.py
    │   │       ├── make_lstm_proto.py
    │   │       ├── make_nnet_proto.py
    │   │       └── subset_data_tr_cv.sh
    │   │   ├── nnet3
    │   │       └── convert_config_tdnn_to_affine.py
    │   │   ├── parallel
    │   │       ├── limit_num_gpus.sh
    │   │       ├── pbs.pl
    │   │       ├── queue.pl
    │   │       ├── retry.pl
    │   │       ├── run.pl
    │   │       └── slurm.pl
    │   │   ├── parse_options.sh
    │   │   ├── pbs.pl
    │   │   ├── perturb_data_dir_speed.sh
    │   │   ├── pinyin_map.pl
    │   │   ├── prepare_extended_lang.sh
    │   │   ├── prepare_lang.sh
    │   │   ├── prepare_online_nnet_dist_build.sh
    │   │   ├── queue.pl
    │   │   ├── remove_data_links.sh
    │   │   ├── remove_oovs.pl
    │   │   ├── require_argument.sh
    │   │   ├── require_argument_all.sh
    │   │   ├── retry.pl
    │   │   ├── reverse_arpa.py
    │   │   ├── rnnlm_compute_scores.sh
    │   │   ├── run.pl
    │   │   ├── s2eps.pl
    │   │   ├── scoring
    │   │       ├── wer_ops_details.pl
    │   │       ├── wer_per_spk_details.pl
    │   │       ├── wer_per_utt_details.pl
    │   │       └── wer_report.pl
    │   │   ├── segmentation.pl
    │   │   ├── show_lattice.sh
    │   │   ├── shuffle_list.pl
    │   │   ├── slurm.pl
    │   │   ├── spk2utt_to_utt2spk.pl
    │   │   ├── split_data.sh
    │   │   ├── split_scp.pl
    │   │   ├── ssh.pl
    │   │   ├── subset_data_dir.sh
    │   │   ├── subset_data_dir_tr_cv.sh
    │   │   ├── subset_scp.pl
    │   │   ├── subword
    │   │       ├── prepare_lang_subword.sh
    │   │       └── prepare_subword_text.sh
    │   │   ├── summarize_logs.pl
    │   │   ├── summarize_warnings.pl
    │   │   ├── sym2int.pl
    │   │   ├── train_arpa_with_kenlm.sh
    │   │   ├── utt2spk_to_spk2utt.pl
    │   │   ├── validate_data_dir.sh
    │   │   ├── validate_dict_dir.pl
    │   │   ├── validate_lang.pl
    │   │   ├── validate_text.pl
    │   │   └── write_kwslist.pl
    ├── my_utils
    │   ├── check.py
    │   ├── generate_phone_scp.py
    │   ├── generate_texts_scp.py
    │   ├── generate_wav_scp.py
    │   ├── merge_scp.py
    │   ├── split_scp.py
    │   └── text_concat.py
    └── tokenizer
    │   ├── MimiCodec
    │       ├── __pycache__
    │       │   └── mimi_tokenizer.cpython-310.pyc
    │       ├── mimi_config.yaml
    │       ├── mimi_tokenizer.py
    │       └── model
    │       │   ├── models
    │       │       ├── MimiCodec.py
    │       │       ├── __init__.py
    │       │       └── __pycache__
    │       │       │   ├── MimiCodec.cpython-310.pyc
    │       │       │   └── __init__.cpython-310.pyc
    │       │   ├── modules
    │       │       ├── __init__.py
    │       │       ├── __pycache__
    │       │       │   ├── __init__.cpython-310.pyc
    │       │       │   ├── conv.cpython-310.pyc
    │       │       │   ├── gating.cpython-310.pyc
    │       │       │   ├── resample.cpython-310.pyc
    │       │       │   ├── rope.cpython-310.pyc
    │       │       │   ├── seanet.cpython-310.pyc
    │       │       │   ├── streaming.cpython-310.pyc
    │       │       │   └── transformer.cpython-310.pyc
    │       │       ├── conv.py
    │       │       ├── gating.py
    │       │       ├── resample.py
    │       │       ├── rope.py
    │       │       ├── seanet.py
    │       │       ├── streaming.py
    │       │       └── transformer.py
    │       │   ├── quantization
    │       │       ├── __init__.py
    │       │       ├── __pycache__
    │       │       │   ├── __init__.cpython-310.pyc
    │       │       │   ├── base.cpython-310.pyc
    │       │       │   ├── core_vq.cpython-310.pyc
    │       │       │   └── vq.cpython-310.pyc
    │       │       ├── base.py
    │       │       ├── core_vq.py
    │       │       └── vq.py
    │       │   └── utils
    │       │       ├── __init__.py
    │       │       ├── __pycache__
    │       │           ├── __init__.cpython-310.pyc
    │       │           └── compile.cpython-310.pyc
    │       │       └── compile.py
    │   ├── Text2ID
    │       ├── __pycache__
    │       │   └── text_tokenizer.cpython-310.pyc
    │       ├── moshi_text_tokenizer.py
    │       └── text_tokenizer.py
    │   ├── __pycache__
    │       ├── abs_tokenizer.cpython-310.pyc
    │       └── common.cpython-310.pyc
    │   ├── abs_tokenizer.py
    │   ├── common.py
    │   └── sampling_text.py
├── trainer
    └── pre_training.py
└── utils
    ├── __init__.py
    ├── __pycache__
        ├── __init__.cpython-310.pyc
        ├── abs_scheduler.cpython-310.pyc
        ├── arguments.cpython-310.pyc
        ├── dataloader.cpython-310.pyc
        ├── reporter.cpython-310.pyc
        ├── task_definition.cpython-310.pyc
        └── train_utils.cpython-310.pyc
    ├── abs_scheduler.py
    ├── arguments.py
    ├── autocast.py
    ├── compile.py
    ├── dataloader.py
    ├── reporter.py
    ├── sampling.py
    ├── task_definition.py
    └── train_utils.py


/.gitignore:
--------------------------------------------------------------------------------
1 | *.wav
2 | __pycache__


--------------------------------------------------------------------------------
/assets/logo.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/assets/logo.png


--------------------------------------------------------------------------------
/docs/dataset.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/docs/dataset.md


--------------------------------------------------------------------------------
/docs/quick_use.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/docs/quick_use.md


--------------------------------------------------------------------------------
/docs/training.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/docs/training.md


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/create_data_json.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/create_data_json.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/config.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/config.json


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/env.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/env.sh


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/main.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/main.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/models/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/models/dnsmos.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/models/dnsmos.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/models/separate_fast.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/models/separate_fast.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/models/silero_vad.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/models/silero_vad.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/models/speaker_diarization.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/models/speaker_diarization.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/models/whisper_asr.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/models/whisper_asr.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/requirements.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/requirements.txt


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/utils/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/utils/logger.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/utils/logger.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/emilia/utils/tool.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/emilia/utils/tool.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/filter_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/filter_scp.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/offline_codec_tokenization.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/offline_codec_tokenization.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/offline_tokenization_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/offline_tokenization_scp.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/offline_tokenization_tar.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/offline_tokenization_tar.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/read_text.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/read_text.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/text_tokenization.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/text_tokenization.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/text_tokenization_reverse.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/text_tokenization_reverse.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/text_tokenization_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/text_tokenization_scp.py


--------------------------------------------------------------------------------
/egs/pretraining/data_scripts/text_tokenization_utt2json.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/data_scripts/text_tokenization_utt2json.py


--------------------------------------------------------------------------------
/egs/pretraining/down.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/down.sh


--------------------------------------------------------------------------------
/egs/pretraining/infer.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/infer.sh


--------------------------------------------------------------------------------
/egs/pretraining/local/asr_whisperx.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/local/asr_whisperx.py


--------------------------------------------------------------------------------
/egs/pretraining/local/asr_whisperx_tar.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/local/asr_whisperx_tar.py


--------------------------------------------------------------------------------
/egs/pretraining/local/vad_segment.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/local/vad_segment.py


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.1.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.1.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.10.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.10.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.11.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.11.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.12.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.12.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.13.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.13.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.14.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.14.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.15.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.15.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.16.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.16.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.17.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.17.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.18.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.18.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.19.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.19.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.2.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.2.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.20.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.20.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.21.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.21.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.22.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.22.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.23.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.23.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.24.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.24.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.25.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.25.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.26.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.26.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.27.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.27.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.28.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.28.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.29.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.29.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.3.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.3.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.30.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.30.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.31.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.31.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.32.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.32.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.33.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.33.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.34.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.34.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.35.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.35.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.36.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.36.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.37.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.37.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.38.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.38.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.39.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.39.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.4.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.4.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.40.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.40.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.41.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.41.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.42.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.42.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.43.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.43.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.44.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.44.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.45.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.45.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.46.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.46.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.47.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.47.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.48.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.48.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.49.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.49.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.5.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.5.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.50.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.50.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.51.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.51.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.52.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.52.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.53.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.53.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.54.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.54.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.55.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.55.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.56.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.56.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.57.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.57.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.58.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.58.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.59.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.59.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.6.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.6.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.60.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.60.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.61.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.61.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.62.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.62.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.63.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.63.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.64.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.64.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.7.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.7.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.8.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.8.log


--------------------------------------------------------------------------------
/egs/pretraining/log/text_token_reverse.9.log:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/log/text_token_reverse.9.log


--------------------------------------------------------------------------------
/egs/pretraining/path.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/path.sh


--------------------------------------------------------------------------------
/egs/pretraining/podcast_output.wav:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/podcast_output.wav


--------------------------------------------------------------------------------
/egs/pretraining/prepare_broadcast_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/prepare_broadcast_data.sh


--------------------------------------------------------------------------------
/egs/pretraining/prepare_hf_tts_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/prepare_hf_tts_data.sh


--------------------------------------------------------------------------------
/egs/pretraining/readme.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/readme.md


--------------------------------------------------------------------------------
/egs/pretraining/run.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/run.sh


--------------------------------------------------------------------------------
/egs/pretraining/test1_en.wav:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/test1_en.wav


--------------------------------------------------------------------------------
/egs/pretraining/utils/run.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/utils/run.pl


--------------------------------------------------------------------------------
/egs/pretraining/utils/split_scp.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/egs/pretraining/utils/split_scp.pl


--------------------------------------------------------------------------------
/inference/generator.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/inference/generator.py


--------------------------------------------------------------------------------
/inference/generator_pod.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/inference/generator_pod.py


--------------------------------------------------------------------------------
/inference/generator_pod_cn.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/inference/generator_pod_cn.py


--------------------------------------------------------------------------------
/llama3_2/config.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/llama3_2/config.json


--------------------------------------------------------------------------------
/llama3_2/special_tokens_map.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/llama3_2/special_tokens_map.json


--------------------------------------------------------------------------------
/llama3_2/tokenizer.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/llama3_2/tokenizer.json


--------------------------------------------------------------------------------
/llama3_2/tokenizer_config.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/llama3_2/tokenizer_config.json


--------------------------------------------------------------------------------
/models/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/models/__pycache__/__init__.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/models/__pycache__/__init__.cpython-310.pyc


--------------------------------------------------------------------------------
/models/__pycache__/model_new.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/models/__pycache__/model_new.cpython-310.pyc


--------------------------------------------------------------------------------
/models/model_new.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/models/model_new.py


--------------------------------------------------------------------------------
/readme.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/readme.md


--------------------------------------------------------------------------------
/tools/data_scripts/create_data_json.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/data_scripts/create_data_json.py


--------------------------------------------------------------------------------
/tools/data_scripts/filter_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/data_scripts/filter_scp.py


--------------------------------------------------------------------------------
/tools/data_scripts/find_peer_utts.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/data_scripts/find_peer_utts.py


--------------------------------------------------------------------------------
/tools/data_scripts/merge_then_split.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/data_scripts/merge_then_split.py


--------------------------------------------------------------------------------
/tools/data_scripts/offline_tokenization.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/data_scripts/offline_tokenization.py


--------------------------------------------------------------------------------
/tools/data_scripts/select_spk2utt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/data_scripts/select_spk2utt.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/add_disambig.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/add_disambig.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/add_lex_disambig.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/add_lex_disambig.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/analyze_segments.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/analyze_segments.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/apply_map.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/apply_map.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/best_wer.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/best_wer.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/build_const_arpa_lm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/build_const_arpa_lm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/build_kenlm_model_from_arpa.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/build_kenlm_model_from_arpa.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/combine_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/combine_data.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/convert_ctm.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/convert_ctm.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/convert_slf.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/convert_slf.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/convert_slf_parallel.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/convert_slf_parallel.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/copy_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/copy_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/create_data_link.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/create_data_link.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/create_split_dir.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/create_split_dir.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/ctm/convert_ctm.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/ctm/convert_ctm.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/ctm/fix_ctm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/ctm/fix_ctm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/ctm/resolve_ctm_overlaps.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/ctm/resolve_ctm_overlaps.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/combine_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/combine_data.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/combine_short_segments.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/combine_short_segments.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/convert_data_dir_to_whole.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/convert_data_dir_to_whole.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/copy_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/copy_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/extend_segment_times.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/extend_segment_times.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/extract_wav_segments_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/extract_wav_segments_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/fix_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/fix_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/fix_subsegment_feats.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/fix_subsegment_feats.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_allowed_durations.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_allowed_durations.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_frame_shift.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_frame_shift.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_num_frames.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_num_frames.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_reco2dur.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_reco2dur.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_reco2utt_for_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_reco2utt_for_data.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_segments_for_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_segments_for_data.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_uniform_subsegments.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_uniform_subsegments.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_utt2dur.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_utt2dur.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/get_utt2num_frames.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/get_utt2num_frames.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/internal/choose_utts_to_combine.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/internal/choose_utts_to_combine.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/internal/combine_segments_to_recording.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/internal/combine_segments_to_recording.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/internal/modify_speaker_info.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/internal/modify_speaker_info.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/internal/perturb_volume.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/internal/perturb_volume.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/limit_feature_dim.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/limit_feature_dim.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/modify_speaker_info.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/modify_speaker_info.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/modify_speaker_info_to_recording.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/modify_speaker_info_to_recording.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/normalize_data_range.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/normalize_data_range.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/perturb_data_dir_speed.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/perturb_data_dir_speed.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/perturb_data_dir_speed_3way.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/perturb_data_dir_speed_3way.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/perturb_data_dir_volume.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/perturb_data_dir_volume.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/perturb_speed_to_allowed_lengths.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/perturb_speed_to_allowed_lengths.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/remove_dup_utts.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/remove_dup_utts.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/resample_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/resample_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/shift_and_combine_feats.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/shift_and_combine_feats.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/shift_feats.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/shift_feats.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/split_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/split_data.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/subsegment_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/subsegment_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/subset_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/subset_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/data/validate_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/data/validate_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/dict_dir_add_pronprobs.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/dict_dir_add_pronprobs.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/eps2disambig.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/eps2disambig.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/filt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/filt.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/filter_scp.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/filter_scp.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/filter_scps.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/filter_scps.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/find_arpa_oovs.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/find_arpa_oovs.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/fix_ctm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/fix_ctm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/fix_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/fix_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/format_lm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/format_lm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/format_lm_sri.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/format_lm_sri.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/gen_topo.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/gen_topo.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/int2sym.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/int2sym.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/kwslist_post_process.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/kwslist_post_process.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/add_lex_disambig.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/add_lex_disambig.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/add_unigrams_arpa.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/add_unigrams_arpa.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/adjust_unk_arpa.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/adjust_unk_arpa.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/adjust_unk_graph.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/adjust_unk_graph.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/bpe/add_final_optional_silence.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/bpe/add_final_optional_silence.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/bpe/apply_bpe.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/bpe/apply_bpe.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/bpe/bidi.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/bpe/bidi.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/bpe/learn_bpe.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/bpe/learn_bpe.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/bpe/prepend_words.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/bpe/prepend_words.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/bpe/reverse.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/bpe/reverse.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/check_g_properties.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/check_g_properties.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/check_phones_compatible.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/check_phones_compatible.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/compute_sentence_probs_arpa.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/compute_sentence_probs_arpa.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/extend_lang.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/extend_lang.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/get_word_position_phone_map.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/get_word_position_phone_map.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/grammar/augment_phones_txt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/grammar/augment_phones_txt.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/grammar/augment_words_txt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/grammar/augment_words_txt.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/internal/apply_unk_lm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/internal/apply_unk_lm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/internal/arpa2fst_constrained.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/internal/arpa2fst_constrained.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/internal/modify_unk_pron.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/internal/modify_unk_pron.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/limit_arpa_unk_history.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/limit_arpa_unk_history.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_kn_lm.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_kn_lm.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_lexicon_fst.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_lexicon_fst.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_lexicon_fst_silprob.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_lexicon_fst_silprob.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_phone_bigram_lang.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_phone_bigram_lang.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_phone_lm.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_phone_lm.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_position_dependent_subword_lexicon.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_position_dependent_subword_lexicon.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_subword_lexicon_fst.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_subword_lexicon_fst.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/make_unk_lm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/make_unk_lm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/ngram_entropy_pruning.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/ngram_entropy_pruning.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/prepare_lang.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/prepare_lang.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/validate_disambig_sym_file.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/validate_disambig_sym_file.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/lang/validate_lang.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/lang/validate_lang.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/ln.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/ln.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/make_absolute.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/make_absolute.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/make_lexicon_fst.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/make_lexicon_fst.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/make_lexicon_fst_silprob.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/make_lexicon_fst_silprob.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/make_unigram_grammar.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/make_unigram_grammar.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/map_arpa_lm.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/map_arpa_lm.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/mkgraph.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/mkgraph.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/mkgraph_lookahead.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/mkgraph_lookahead.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet-cpu/make_nnet_config.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet-cpu/make_nnet_config.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet-cpu/make_nnet_config_block.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet-cpu/make_nnet_config_block.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet-cpu/make_nnet_config_preconditioned.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet-cpu/make_nnet_config_preconditioned.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet-cpu/update_learning_rates.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet-cpu/update_learning_rates.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/gen_dct_mat.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/gen_dct_mat.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/gen_hamm_mat.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/gen_hamm_mat.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/gen_splice.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/gen_splice.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/make_blstm_proto.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/make_blstm_proto.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/make_cnn_proto.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/make_cnn_proto.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/make_lstm_proto.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/make_lstm_proto.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/make_nnet_proto.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/make_nnet_proto.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet/subset_data_tr_cv.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet/subset_data_tr_cv.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/nnet3/convert_config_tdnn_to_affine.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/nnet3/convert_config_tdnn_to_affine.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/parallel/limit_num_gpus.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parallel/limit_num_gpus.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/parallel/pbs.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parallel/pbs.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/parallel/queue.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parallel/queue.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/parallel/retry.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parallel/retry.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/parallel/run.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parallel/run.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/parallel/slurm.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parallel/slurm.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/parse_options.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/parse_options.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/pbs.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/pbs.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/perturb_data_dir_speed.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/perturb_data_dir_speed.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/pinyin_map.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/pinyin_map.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/prepare_extended_lang.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/prepare_extended_lang.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/prepare_lang.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/prepare_lang.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/prepare_online_nnet_dist_build.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/prepare_online_nnet_dist_build.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/queue.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/queue.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/remove_data_links.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/remove_data_links.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/remove_oovs.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/remove_oovs.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/require_argument.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/require_argument.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/require_argument_all.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/require_argument_all.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/retry.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/retry.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/reverse_arpa.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/reverse_arpa.py


--------------------------------------------------------------------------------
/tools/kaldi/utils/rnnlm_compute_scores.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/rnnlm_compute_scores.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/run.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/run.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/s2eps.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/s2eps.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/scoring/wer_ops_details.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/scoring/wer_ops_details.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/scoring/wer_per_spk_details.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/scoring/wer_per_spk_details.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/scoring/wer_per_utt_details.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/scoring/wer_per_utt_details.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/scoring/wer_report.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/scoring/wer_report.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/segmentation.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/segmentation.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/show_lattice.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/show_lattice.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/shuffle_list.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/shuffle_list.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/slurm.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/slurm.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/spk2utt_to_utt2spk.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/spk2utt_to_utt2spk.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/split_data.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/split_data.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/split_scp.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/split_scp.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/ssh.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/ssh.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/subset_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/subset_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/subset_data_dir_tr_cv.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/subset_data_dir_tr_cv.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/subset_scp.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/subset_scp.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/subword/prepare_lang_subword.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/subword/prepare_lang_subword.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/subword/prepare_subword_text.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/subword/prepare_subword_text.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/summarize_logs.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/summarize_logs.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/summarize_warnings.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/summarize_warnings.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/sym2int.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/sym2int.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/train_arpa_with_kenlm.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/train_arpa_with_kenlm.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/utt2spk_to_spk2utt.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/utt2spk_to_spk2utt.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/validate_data_dir.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/validate_data_dir.sh


--------------------------------------------------------------------------------
/tools/kaldi/utils/validate_dict_dir.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/validate_dict_dir.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/validate_lang.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/validate_lang.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/validate_text.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/validate_text.pl


--------------------------------------------------------------------------------
/tools/kaldi/utils/write_kwslist.pl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/kaldi/utils/write_kwslist.pl


--------------------------------------------------------------------------------
/tools/my_utils/check.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/check.py


--------------------------------------------------------------------------------
/tools/my_utils/generate_phone_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/generate_phone_scp.py


--------------------------------------------------------------------------------
/tools/my_utils/generate_texts_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/generate_texts_scp.py


--------------------------------------------------------------------------------
/tools/my_utils/generate_wav_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/generate_wav_scp.py


--------------------------------------------------------------------------------
/tools/my_utils/merge_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/merge_scp.py


--------------------------------------------------------------------------------
/tools/my_utils/split_scp.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/split_scp.py


--------------------------------------------------------------------------------
/tools/my_utils/text_concat.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/my_utils/text_concat.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/__pycache__/mimi_tokenizer.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/__pycache__/mimi_tokenizer.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/mimi_config.yaml:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/mimi_config.yaml


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/mimi_tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/mimi_tokenizer.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/models/MimiCodec.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/models/MimiCodec.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/models/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/models/__pycache__/MimiCodec.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/models/__pycache__/MimiCodec.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/models/__pycache__/__init__.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/models/__pycache__/__init__.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/__init__.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/__init__.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/conv.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/conv.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/gating.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/gating.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/resample.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/resample.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/rope.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/rope.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/seanet.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/seanet.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/streaming.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/streaming.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/__pycache__/transformer.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/__pycache__/transformer.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/conv.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/conv.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/gating.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/gating.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/resample.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/resample.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/rope.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/rope.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/seanet.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/seanet.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/streaming.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/streaming.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/modules/transformer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/modules/transformer.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/__init__.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/__pycache__/__init__.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/__pycache__/__init__.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/__pycache__/base.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/__pycache__/base.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/__pycache__/core_vq.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/__pycache__/core_vq.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/__pycache__/vq.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/__pycache__/vq.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/base.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/base.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/core_vq.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/core_vq.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/quantization/vq.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/quantization/vq.py


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/utils/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/utils/__pycache__/__init__.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/utils/__pycache__/__init__.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/utils/__pycache__/compile.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/utils/__pycache__/compile.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/MimiCodec/model/utils/compile.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/MimiCodec/model/utils/compile.py


--------------------------------------------------------------------------------
/tools/tokenizer/Text2ID/__pycache__/text_tokenizer.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/Text2ID/__pycache__/text_tokenizer.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/Text2ID/moshi_text_tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/Text2ID/moshi_text_tokenizer.py


--------------------------------------------------------------------------------
/tools/tokenizer/Text2ID/text_tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/Text2ID/text_tokenizer.py


--------------------------------------------------------------------------------
/tools/tokenizer/__pycache__/abs_tokenizer.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/__pycache__/abs_tokenizer.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/__pycache__/common.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/__pycache__/common.cpython-310.pyc


--------------------------------------------------------------------------------
/tools/tokenizer/abs_tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/abs_tokenizer.py


--------------------------------------------------------------------------------
/tools/tokenizer/common.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/common.py


--------------------------------------------------------------------------------
/tools/tokenizer/sampling_text.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/tools/tokenizer/sampling_text.py


--------------------------------------------------------------------------------
/trainer/pre_training.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/trainer/pre_training.py


--------------------------------------------------------------------------------
/utils/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__init__.py


--------------------------------------------------------------------------------
/utils/__pycache__/__init__.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/__init__.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/__pycache__/abs_scheduler.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/abs_scheduler.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/__pycache__/arguments.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/arguments.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/__pycache__/dataloader.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/dataloader.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/__pycache__/reporter.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/reporter.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/__pycache__/task_definition.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/task_definition.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/__pycache__/train_utils.cpython-310.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/__pycache__/train_utils.cpython-310.pyc


--------------------------------------------------------------------------------
/utils/abs_scheduler.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/abs_scheduler.py


--------------------------------------------------------------------------------
/utils/arguments.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/arguments.py


--------------------------------------------------------------------------------
/utils/autocast.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/autocast.py


--------------------------------------------------------------------------------
/utils/compile.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/compile.py


--------------------------------------------------------------------------------
/utils/dataloader.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/dataloader.py


--------------------------------------------------------------------------------
/utils/reporter.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/reporter.py


--------------------------------------------------------------------------------
/utils/sampling.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/sampling.py


--------------------------------------------------------------------------------
/utils/task_definition.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/task_definition.py


--------------------------------------------------------------------------------
/utils/train_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Audio-Foundation-Models/ConversationTTS/HEAD/utils/train_utils.py


--------------------------------------------------------------------------------