gitextract_uly26sb1/ ├── .gitignore ├── .pre-commit-config.yaml ├── LICENSE ├── README.md ├── analysis/ │ ├── TMalign │ ├── TMalign.cpp │ ├── TMscore │ ├── TMscore.cpp │ ├── cal_plddt_dir.py │ ├── cal_tmscore.py │ ├── motif_analysis.ipynb │ ├── plddt_calculate.sh │ ├── plot.ipynb │ └── uncond_analysis.ipynb ├── configs/ │ ├── callbacks/ │ │ ├── default.yaml │ │ ├── fixedbb.yaml │ │ ├── lm.yaml │ │ └── structok.yaml │ ├── config.yaml │ ├── datamodule/ │ │ ├── cath_4.3.yaml │ │ ├── pdb.yaml │ │ ├── tokenized_protein.yaml │ │ ├── uniref50.yaml │ │ └── uniref50_hf.yaml │ ├── experiment/ │ │ ├── base.yaml │ │ ├── dplm/ │ │ │ ├── cond_dplm_150m.yaml │ │ │ ├── cond_dplm_3b.yaml │ │ │ ├── cond_dplm_650m.yaml │ │ │ ├── dplm_150m.yaml │ │ │ ├── dplm_150m_ds.yaml │ │ │ ├── dplm_150m_stage2.yaml │ │ │ ├── dplm_15b_ds.yaml │ │ │ ├── dplm_30b_ds.yaml │ │ │ ├── dplm_3b.yaml │ │ │ ├── dplm_3b_ds.yaml │ │ │ ├── dplm_3b_stage2.yaml │ │ │ ├── dplm_650m.yaml │ │ │ ├── dplm_650m_ds.yaml │ │ │ ├── dplm_650m_stage2.yaml │ │ │ └── mlm_150m.yaml │ │ ├── dplm2/ │ │ │ ├── dplm2_150m.yaml │ │ │ ├── dplm2_3b.yaml │ │ │ ├── dplm2_650m.yaml │ │ │ ├── dplm2_650m_selfmixup.yaml │ │ │ └── dplm2_bit_650m.yaml │ │ └── structok/ │ │ ├── inference/ │ │ │ ├── forward_folding.yaml │ │ │ ├── inverse_folding.yaml │ │ │ ├── reconstruction.yaml │ │ │ ├── unconditional.yaml │ │ │ └── unconditional_codesign.yaml │ │ └── structok_lfq_8k_pdb_swissprot_c512.yaml │ ├── hydra/ │ │ └── default.yaml │ ├── logger/ │ │ ├── tensorboard.yaml │ │ └── wandb.yaml │ ├── paths/ │ │ └── default.yaml │ ├── test.yaml │ └── trainer/ │ ├── ddp.yaml │ ├── ddp_bf16.yaml │ ├── ddp_fp16.yaml │ ├── deepspeed_zero2.yaml │ ├── deepspeed_zero2_bf16.yaml │ ├── deepspeed_zero2_fp16.yaml │ ├── deepspeed_zero2_offload.yaml │ ├── deepspeed_zero3.yaml │ ├── deepspeed_zero3_bf16.yaml │ └── default.yaml ├── env.yml ├── generate_dplm.py ├── generate_dplm2.py ├── requirements.txt ├── run/ │ ├── scaffold_generate_dplm.py │ └── scaffold_generate_dplm2.py ├── scripts/ │ ├── download_cath.sh │ ├── download_metadata.sh │ ├── download_motif_scaffolds.sh │ ├── download_pdb_swissprot_hf.sh │ ├── download_uniref50_hf.sh │ └── install.sh ├── setup.cfg ├── setup.py ├── src/ │ └── byprot/ │ ├── __init__.py │ ├── datamodules/ │ │ ├── __init__.py │ │ ├── cath_datamodule.py │ │ ├── dataset/ │ │ │ ├── __init__.py │ │ │ ├── cath.py │ │ │ ├── data_utils.py │ │ │ ├── tokenized_protein.py │ │ │ ├── uniref.py │ │ │ └── uniref_hf.py │ │ ├── pdb_dataset/ │ │ │ ├── __init__.py │ │ │ ├── all_atom.py │ │ │ ├── pdb_datamodule.py │ │ │ ├── protein.py │ │ │ ├── residue_constants.py │ │ │ └── utils.py │ │ ├── tokenized_protein_datamodule.py │ │ ├── uniref50.py │ │ └── uniref50_hf.py │ ├── models/ │ │ ├── __init__.py │ │ ├── dplm/ │ │ │ ├── __init__.py │ │ │ ├── dplm.py │ │ │ ├── dplm_invfold.py │ │ │ └── modules/ │ │ │ ├── dplm_adapter.py │ │ │ ├── dplm_modeling_esm.py │ │ │ └── gvp_transformer_encoder.py │ │ ├── dplm2/ │ │ │ ├── __init__.py │ │ │ ├── dplm2.py │ │ │ ├── dplm2_bit.py │ │ │ └── modules/ │ │ │ ├── dplm2_bit_modeling_esm.py │ │ │ └── dplm2_modeling_esm.py │ │ ├── structok/ │ │ │ ├── modules/ │ │ │ │ ├── ema.py │ │ │ │ ├── folding_utils/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── categorical_mixture.py │ │ │ │ │ ├── decoder.py │ │ │ │ │ ├── esmfold.py │ │ │ │ │ ├── misc.py │ │ │ │ │ ├── pretrained.py │ │ │ │ │ ├── structure_module.py │ │ │ │ │ ├── tri_self_attn_block.py │ │ │ │ │ └── trunk.py │ │ │ │ ├── gvp_encoder.py │ │ │ │ ├── lfq.py │ │ │ │ ├── loss.py │ │ │ │ ├── nn.py │ │ │ │ └── vqvae.py │ │ │ └── structok_lfq.py │ │ └── utils.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── cross_entropy.py │ │ ├── metrics.py │ │ └── protein_metrics.py │ ├── tasks/ │ │ ├── __init__.py │ │ ├── lm/ │ │ │ ├── dplm.py │ │ │ ├── dplm2.py │ │ │ ├── dplm_invfold.py │ │ │ └── mlm.py │ │ └── struct_tokenizer/ │ │ └── structok.py │ ├── testing_pipeline.py │ ├── training_pipeline.py │ └── utils/ │ ├── __init__.py │ ├── callbacks.py │ ├── config.py │ ├── io.py │ ├── logger.py │ ├── lr_scheduler.py │ ├── optim.py │ ├── protein/ │ │ ├── __init__.py │ │ ├── all_atom.py │ │ ├── evaluator_dplm2.py │ │ ├── folding_model.py │ │ ├── residue_constants.py │ │ ├── tokenize_pdb.py │ │ └── utils.py │ ├── registry.py │ ├── scaffold_utils.py │ └── strategies.py ├── test.py ├── train.py └── vendor/ └── openfold/ ├── CITATION.cff ├── Dockerfile ├── LICENSE ├── README.md ├── deepspeed_config.json ├── environment.yml ├── notebooks/ │ ├── OpenFold.ipynb │ └── environment.yml ├── openfold/ │ ├── __init__.py │ ├── config.py │ ├── data/ │ │ ├── __init__.py │ │ ├── data_modules.py │ │ ├── data_pipeline.py │ │ ├── data_transforms.py │ │ ├── errors.py │ │ ├── feature_pipeline.py │ │ ├── input_pipeline.py │ │ ├── mmcif_parsing.py │ │ ├── parsers.py │ │ ├── templates.py │ │ └── tools/ │ │ ├── __init__.py │ │ ├── hhblits.py │ │ ├── hhsearch.py │ │ ├── jackhmmer.py │ │ ├── kalign.py │ │ └── utils.py │ ├── model/ │ │ ├── __init__.py │ │ ├── dropout.py │ │ ├── embedders.py │ │ ├── evoformer.py │ │ ├── heads.py │ │ ├── model.py │ │ ├── msa.py │ │ ├── outer_product_mean.py │ │ ├── pair_transition.py │ │ ├── primitives.py │ │ ├── structure_module.py │ │ ├── template.py │ │ ├── torchscript.py │ │ ├── triangular_attention.py │ │ └── triangular_multiplicative_update.py │ ├── np/ │ │ ├── __init__.py │ │ ├── protein.py │ │ ├── relax/ │ │ │ ├── __init__.py │ │ │ ├── amber_minimize.py │ │ │ ├── cleanup.py │ │ │ ├── relax.py │ │ │ └── utils.py │ │ └── residue_constants.py │ ├── resources/ │ │ ├── __init__.py │ │ └── stereo_chemical_props.txt │ └── utils/ │ ├── __init__.py │ ├── argparse.py │ ├── callbacks.py │ ├── checkpointing.py │ ├── chunk_utils.py │ ├── exponential_moving_average.py │ ├── feats.py │ ├── import_weights.py │ ├── kernel/ │ │ ├── __init__.py │ │ ├── attention_core.py │ │ └── csrc/ │ │ ├── compat.h │ │ ├── softmax_cuda.cpp │ │ ├── softmax_cuda_kernel.cu │ │ └── softmax_cuda_stub.cpp │ ├── logger.py │ ├── loss.py │ ├── lr_schedulers.py │ ├── precision_utils.py │ ├── rigid_utils.py │ ├── script_utils.py │ ├── seed.py │ ├── superimposition.py │ ├── suppress_output.py │ ├── tensor_utils.py │ ├── trace_utils.py │ └── validation_metrics.py ├── run_pretrained_openfold.py ├── scripts/ │ ├── activate_conda_env.sh │ ├── alignment_db_scripts/ │ │ ├── create_alignment_db.py │ │ └── unify_alignment_db_indices.py │ ├── build_deepspeed_config.py │ ├── colabfold_search.sh │ ├── convert_of_weights_to_jax.py │ ├── data_dir_to_fasta.py │ ├── deactivate_conda_env.sh │ ├── download_alphafold_dbs.sh │ ├── download_alphafold_params.sh │ ├── download_bfd.sh │ ├── download_cameo.py │ ├── download_colabfold_envdb.sh │ ├── download_mgnify.sh │ ├── download_mmseqs_dbs.sh │ ├── download_openfold_params.sh │ ├── download_openfold_params_gdrive.sh │ ├── download_openfold_params_huggingface.sh │ ├── download_pdb70.sh │ ├── download_pdb_mmcif.sh │ ├── download_roda_pdbs.sh │ ├── download_small_bfd.sh │ ├── download_uniclust30.sh │ ├── download_uniref30.sh │ ├── download_uniref90.sh │ ├── flatten_roda.sh │ ├── generate_alphafold_feature_dict.py │ ├── generate_chain_data_cache.py │ ├── generate_mmcif_cache.py │ ├── install_hh_suite.sh │ ├── install_third_party_dependencies.sh │ ├── precompute_alignments.py │ ├── precompute_alignments_mmseqs.py │ ├── precompute_embeddings.py │ ├── prep_mmseqs_dbs.sh │ ├── prep_proteinnet_msas.py │ ├── run_unit_tests.sh │ ├── slurm_scripts/ │ │ └── run_uniclust30_search.sh │ ├── unpack_proteinnet.py │ ├── utils.py │ ├── vars.sh │ └── zero_to_fp32.py ├── setup.py ├── tests/ │ ├── __init__.py │ ├── compare_utils.py │ ├── config.py │ ├── data_utils.py │ ├── test_data/ │ │ ├── alignments/ │ │ │ ├── bfd_uniclust_hits.a3m │ │ │ ├── mgnify_hits.sto │ │ │ ├── pdb70_hits.hhr │ │ │ └── uniref90_hits.sto │ │ ├── alphafold_feature_dict.pickle │ │ ├── features.pkl │ │ ├── mmcifs/ │ │ │ ├── 1hf9.cif │ │ │ ├── 1psm.cif │ │ │ ├── 2crb.cif │ │ │ ├── 2q2k.cif │ │ │ ├── 3u8v.cif │ │ │ ├── 3zee.cif │ │ │ ├── 4i6p.cif │ │ │ ├── 4zey.cif │ │ │ └── 5kc1.cif │ │ └── short.fasta │ ├── test_data_pipeline.py │ ├── test_data_transforms.py │ ├── test_embedders.py │ ├── test_evoformer.py │ ├── test_feats.py │ ├── test_import_weights.py │ ├── test_kernels.py │ ├── test_loss.py │ ├── test_model.py │ ├── test_msa.py │ ├── test_outer_product_mean.py │ ├── test_pair_transition.py │ ├── test_primitives.py │ ├── test_structure_module.py │ ├── test_template.py │ ├── test_triangular_attention.py │ ├── test_triangular_multiplicative_update.py │ └── test_utils.py ├── thread_sequence.py └── train_openfold.py