gitextract_xof_5l96/ ├── .agents/ │ └── skills/ │ ├── claude-on-vertex-ci/ │ │ └── SKILL.md │ ├── container-vulns/ │ │ └── SKILL.md │ ├── dsub-batch-jobs/ │ │ └── SKILL.md │ └── regression-testing/ │ ├── SKILL.md │ ├── compare_sample_pair.py │ ├── discover_pairs.py │ ├── generate_report.py │ └── run_vadr.sh ├── .claude/ │ └── rules/ │ └── container-vulns.md ├── .codecov.yml ├── .dockerignore ├── .gitattributes ├── .github/ │ ├── actions/ │ │ ├── create-manifest/ │ │ │ └── action.yml │ │ ├── pull-with-retry/ │ │ │ └── action.yml │ │ └── setup-docker-build/ │ │ └── action.yml │ ├── copilot-instructions.md │ └── workflows/ │ ├── audit-quay-tags.yml │ ├── cleanup-images.yml │ ├── container-scan.yml │ ├── docker.yml │ └── docs.yml ├── .gitignore ├── .readthedocs.yml ├── .trivy-ignore-policy.rego ├── .trivyignore ├── AGENTS.md ├── CLAUDE.md ├── LICENSE ├── README.md ├── docker/ │ ├── Dockerfile.assemble │ ├── Dockerfile.baseimage │ ├── Dockerfile.classify │ ├── Dockerfile.core │ ├── Dockerfile.mega │ ├── Dockerfile.phylo │ ├── install-conda-deps.sh │ ├── requirements/ │ │ ├── assemble-x86.txt │ │ ├── assemble.txt │ │ ├── baseimage.txt │ │ ├── classify-x86.txt │ │ ├── classify.txt │ │ ├── core-x86.txt │ │ ├── core.txt │ │ ├── phylo-x86.txt │ │ └── phylo.txt │ └── scripts/ │ ├── calc_mem.py │ └── fasta-trim-terminal-ambigs.pl ├── docs/ │ ├── Makefile │ ├── assembly.rst │ ├── broad_utils.rst │ ├── cmdline.rst │ ├── conf.py │ ├── description.rst │ ├── file_utils.rst │ ├── illumina.rst │ ├── index.rst │ ├── interhost.rst │ ├── intrahost.rst │ ├── kmer_utils.rst │ ├── metagenomics.rst │ ├── ncbi.rst │ ├── read_utils.rst │ ├── reports.rst │ ├── requirements.txt │ └── taxon_filter.rst ├── pyproject.toml ├── src/ │ └── viral_ngs/ │ ├── __init__.py │ ├── assemble/ │ │ ├── __init__.py │ │ ├── freebayes.py │ │ ├── gap2seq.py │ │ ├── mafft.py │ │ ├── mummer.py │ │ ├── muscle.py │ │ ├── rasusa.py │ │ ├── skani.py │ │ ├── spades.py │ │ ├── vcf.py │ │ └── wgsim.py │ ├── assembly.py │ ├── broad_utils.py │ ├── classify/ │ │ ├── __init__.py │ │ ├── blast.py │ │ ├── bmtagger.py │ │ ├── kb.py │ │ ├── kma.py │ │ ├── kmc.py │ │ ├── kraken2.py │ │ ├── krona.py │ │ ├── last.py │ │ └── taxonomy.py │ ├── core/ │ │ ├── __init__.py │ │ ├── bbmap.py │ │ ├── bwa.py │ │ ├── cdhit.py │ │ ├── cmd.py │ │ ├── errors.py │ │ ├── fastqc.py │ │ ├── file.py │ │ ├── illumina_indices.py │ │ ├── illumina_utils.py │ │ ├── minimap2.py │ │ ├── misc.py │ │ ├── mvicuna.py │ │ ├── novoalign.py │ │ ├── picard.py │ │ ├── prinseq.py │ │ ├── priorities.py │ │ ├── sambamba.py │ │ ├── samtools.py │ │ ├── splitcode.py │ │ ├── stats.py │ │ ├── trimmomatic.py │ │ └── version.py │ ├── file_utils.py │ ├── illumina.py │ ├── interhost.py │ ├── intrahost.py │ ├── kmer_utils.py │ ├── metagenomics.py │ ├── ncbi.py │ ├── phylo/ │ │ ├── __init__.py │ │ ├── feature_table.py │ │ ├── feature_table_types.py │ │ ├── genbank.py │ │ ├── mafft.py │ │ ├── mummer.py │ │ ├── muscle.py │ │ ├── snpeff.py │ │ ├── vcf.py │ │ └── vphaser2.py │ ├── py.typed │ ├── read_utils.py │ ├── reports.py │ └── taxon_filter.py └── tests/ ├── __init__.py ├── conftest.py ├── input/ │ ├── 5kb_human_from_chr6.fasta │ ├── G5012.3.fasta │ ├── G5012.3.mini.bam │ ├── G5012.3.subset.bam │ ├── G5012.3.testreads.bam │ ├── README.md │ ├── TestAssembleSpades/ │ │ ├── clipDb.fasta │ │ └── trinity_contigs.fasta │ ├── TestBamFilter/ │ │ ├── expected.bam │ │ └── input.bam │ ├── TestBlastnDbBuild/ │ │ └── expected/ │ │ ├── TestBlastnDbBuild.nhr │ │ ├── TestBlastnDbBuild.nin │ │ └── TestBlastnDbBuild.nsq │ ├── TestBmtagger/ │ │ ├── expected.Match.1.fastq │ │ ├── expected.Match.2.fastq │ │ ├── expected.NoMatch.1.fastq │ │ ├── expected.NoMatch.2.fastq │ │ ├── humanChr1Subset.bitmask │ │ ├── humanChr1Subset.fa │ │ ├── humanChr9Subset.bitmask │ │ ├── humanChr9Subset.fa │ │ ├── in1.fastq │ │ └── in2.fastq │ ├── TestBmtaggerDbBuild/ │ │ └── expected/ │ │ ├── TestBmtaggerDbBuild.bitmask │ │ ├── TestBmtaggerDbBuild.srprism.amp │ │ ├── TestBmtaggerDbBuild.srprism.idx.md5 │ │ ├── TestBmtaggerDbBuild.srprism.imp │ │ ├── TestBmtaggerDbBuild.srprism.map.md5 │ │ ├── TestBmtaggerDbBuild.srprism.pmp │ │ ├── TestBmtaggerDbBuild.srprism.rmp │ │ ├── TestBmtaggerDbBuild.srprism.ss.md5 │ │ ├── TestBmtaggerDbBuild.srprism.ssa │ │ └── TestBmtaggerDbBuild.srprism.ssd │ ├── TestDepleteBlastnBam/ │ │ ├── expected.sam │ │ ├── humanChr1Subset.fa │ │ ├── humanChr9Subset.fa │ │ └── in.bam │ ├── TestDepleteHuman/ │ │ ├── aligned-expected/ │ │ │ ├── test-reads.blastn.bam │ │ │ ├── test-reads.bmtagger.bam │ │ │ ├── test-reads.bwa.bam │ │ │ ├── test-reads.revert.bam │ │ │ ├── test-reads.rmdup.bam │ │ │ └── test-reads.taxfilt.imperfect.bam │ │ ├── expected/ │ │ │ ├── test-reads.blastn.bam │ │ │ ├── test-reads.bmtagger.bam │ │ │ ├── test-reads.bwa.bam │ │ │ ├── test-reads.revert.bam │ │ │ ├── test-reads.rmdup.bam │ │ │ ├── test-reads.taxfilt.bam │ │ │ ├── test-reads.taxfilt.imperfect-2.bam │ │ │ └── test-reads.taxfilt.imperfect.bam │ │ ├── partial_pan-viral-9seqs-with-human-random-subset.fasta │ │ ├── test-reads-aligned.bam │ │ ├── test-reads-human.bam │ │ └── test-reads.bam │ ├── TestDifficultSampleNames/ │ │ ├── RunInfo.xml │ │ ├── SampleSheet-inline-commas-strings.csv │ │ └── SampleSheet.csv │ ├── TestFastaFetch/ │ │ ├── JQ610675.1.fa │ │ ├── JQ610675.1.fasta │ │ ├── JQ610676.1.fa │ │ ├── JQ610676.1.fasta │ │ ├── JQ610677.1.fa │ │ ├── JQ610677.1.fasta │ │ ├── JQ610678.1.fa │ │ ├── JQ610678.1.fasta │ │ ├── JQ610679.1.fa │ │ ├── JQ610679.1.fasta │ │ ├── JQ610680.1.fa │ │ ├── JQ610680.1.fasta │ │ ├── JQ610681.1.fa │ │ ├── JQ610681.1.fasta │ │ ├── JQ610682.1.fa │ │ ├── JQ610682.1.fasta │ │ ├── JQ610683.1.fa │ │ ├── JQ610683.1.fasta │ │ ├── JQ610684.1.fa │ │ ├── JQ610684.1.fasta │ │ ├── orungo.fa │ │ └── orungo.fasta │ ├── TestFastqBam/ │ │ ├── expected.fastq1 │ │ ├── expected.java1_7.sam │ │ ├── expected.java1_8.sam │ │ ├── expected.java1_8_v1.5.sam │ │ ├── in1.fastq │ │ ├── in2.fastq │ │ └── inHeader.txt │ ├── TestFeatureReader/ │ │ ├── GU481072.1.tbl │ │ ├── GU481073.1.tbl │ │ ├── KM821772.1.tbl │ │ ├── KM821773.1.tbl │ │ ├── LC889323.1.tbl │ │ ├── NC_026438.1.tbl │ │ ├── test1-S.tbl │ │ └── test2-L.tbl │ ├── TestFeatureTableFetch/ │ │ ├── JQ610675.1.table │ │ ├── JQ610675.1.tbl │ │ ├── JQ610676.1.table │ │ ├── JQ610676.1.tbl │ │ ├── JQ610677.1.table │ │ ├── JQ610677.1.tbl │ │ ├── JQ610678.1.table │ │ ├── JQ610678.1.tbl │ │ ├── JQ610679.1.table │ │ ├── JQ610679.1.tbl │ │ ├── JQ610680.1.table │ │ ├── JQ610680.1.tbl │ │ ├── JQ610681.1.table │ │ ├── JQ610681.1.tbl │ │ ├── JQ610682.1.table │ │ ├── JQ610682.1.tbl │ │ ├── JQ610683.1.table │ │ ├── JQ610683.1.tbl │ │ ├── JQ610684.1.table │ │ ├── JQ610684.1.tbl │ │ ├── orungo.table │ │ └── orungo.tbl │ ├── TestFeatureTransfer/ │ │ ├── adenovirus_truncated/ │ │ │ ├── expected/ │ │ │ │ └── mapped.tbl │ │ │ └── input/ │ │ │ ├── aligned_1.fasta │ │ │ ├── ref.fasta │ │ │ └── ref.tbl │ │ ├── internal_partials/ │ │ │ ├── expected/ │ │ │ │ └── mapped.tbl │ │ │ └── input/ │ │ │ ├── aligned_1.fasta │ │ │ ├── ref.fasta │ │ │ └── ref.tbl │ │ ├── lasv/ │ │ │ ├── expected/ │ │ │ │ ├── LASV_NGA_2018_0026-1.tbl │ │ │ │ ├── LASV_NGA_2018_0026-2.tbl │ │ │ │ ├── LASV_NGA_2018_0097-1.tbl │ │ │ │ ├── LASV_NGA_2018_0097-2.tbl │ │ │ │ ├── LASV_NGA_2018_0541-1.tbl │ │ │ │ ├── LASV_NGA_2018_0541-2.tbl │ │ │ │ ├── LASV_NGA_2018_0611-1.tbl │ │ │ │ ├── LASV_NGA_2018_0611-2.tbl │ │ │ │ ├── LASV_NGA_2018_0664-1.tbl │ │ │ │ ├── LASV_NGA_2018_0664-2.tbl │ │ │ │ ├── LASV_NGA_2018_0959-1.tbl │ │ │ │ ├── LASV_NGA_2018_0959-2.tbl │ │ │ │ ├── LASV_NGA_2018_0998-1.tbl │ │ │ │ ├── LASV_NGA_2018_0998-2.tbl │ │ │ │ ├── LASV_NGA_2018_1024-1.tbl │ │ │ │ ├── LASV_NGA_2018_1024-2.tbl │ │ │ │ ├── LASV_NGA_2018_1079-1.tbl │ │ │ │ ├── LASV_NGA_2018_1079-2.tbl │ │ │ │ ├── LASV_NGA_2018_1177-1.tbl │ │ │ │ ├── LASV_NGA_2018_1177-2.tbl │ │ │ │ ├── LASV_NGA_2018_1375-1.tbl │ │ │ │ ├── LASV_NGA_2018_1375-2.tbl │ │ │ │ ├── LASV_NGA_2018_1381-1.tbl │ │ │ │ ├── LASV_NGA_2018_1381-2.tbl │ │ │ │ ├── LASV_NGA_2018_1392-1.tbl │ │ │ │ ├── LASV_NGA_2018_1392-2.tbl │ │ │ │ ├── LASV_NGA_2018_1643-1.tbl │ │ │ │ ├── LASV_NGA_2018_1643-2.tbl │ │ │ │ └── test.tbl │ │ │ └── input/ │ │ │ ├── KM821997.1.tbl │ │ │ ├── KM821998.1.tbl │ │ │ ├── align_mafft-ref-lasv-ISTH2376_1.fasta │ │ │ ├── align_mafft-ref-lasv-ISTH2376_2.fasta │ │ │ └── ref-lasv-ISTH2376.fasta │ │ ├── negative_strand_partial/ │ │ │ ├── expected/ │ │ │ │ └── mapped.tbl │ │ │ └── input/ │ │ │ ├── aligned_1.fasta │ │ │ ├── ref.fasta │ │ │ └── ref.tbl │ │ ├── synthetic/ │ │ │ ├── expected/ │ │ │ │ └── mapped.tbl │ │ │ └── input/ │ │ │ ├── aligned_1.fasta │ │ │ ├── ref.fasta │ │ │ └── ref.tbl │ │ ├── synthetic_ignore_ambig_edges/ │ │ │ ├── expected/ │ │ │ │ └── mapped.tbl │ │ │ └── input/ │ │ │ ├── aligned_1.fasta │ │ │ ├── ref.fasta │ │ │ └── ref.tbl │ │ └── synthetic_oob_clip/ │ │ ├── expected/ │ │ │ └── mapped.tbl │ │ └── input/ │ │ ├── aligned_1.fasta │ │ ├── ref.fasta │ │ └── ref.tbl │ ├── TestFilterLastal/ │ │ ├── expected.fastq │ │ └── in.fastq │ ├── TestGap2Seq/ │ │ └── expected.ebov.doublehit.gapfill.fasta │ ├── TestGenbankRecordFetch/ │ │ ├── JQ610675.1.gb │ │ ├── JQ610675.1.gbk │ │ ├── JQ610676.1.gb │ │ ├── JQ610676.1.gbk │ │ ├── JQ610677.1.gb │ │ ├── JQ610677.1.gbk │ │ ├── JQ610678.1.gb │ │ ├── JQ610678.1.gbk │ │ ├── JQ610679.1.gb │ │ ├── JQ610679.1.gbk │ │ ├── JQ610680.1.gb │ │ ├── JQ610680.1.gbk │ │ ├── JQ610681.1.gb │ │ ├── JQ610681.1.gbk │ │ ├── JQ610682.1.gb │ │ ├── JQ610682.1.gbk │ │ ├── JQ610683.1.gb │ │ ├── JQ610683.1.gbk │ │ ├── JQ610684.1.gb │ │ ├── JQ610684.1.gbk │ │ ├── orungo.gb │ │ └── orungo.gbk │ ├── TestIlluminaBarcodeHelper/ │ │ ├── ambiguous/ │ │ │ ├── barcodes.txt │ │ │ ├── expected.txt │ │ │ └── metrics.txt │ │ ├── few_assigned/ │ │ │ ├── barcodes.txt │ │ │ └── metrics.txt │ │ ├── one_correction/ │ │ │ ├── barcodes.txt │ │ │ ├── expected.txt │ │ │ └── metrics.txt │ │ ├── single_index/ │ │ │ ├── barcodes.txt │ │ │ ├── expected.txt │ │ │ └── metrics.txt │ │ └── single_index_i5_only/ │ │ ├── barcodes.txt │ │ ├── expected.txt │ │ └── metrics.txt │ ├── TestIlluminaDir/ │ │ ├── bcl-indented.tgz │ │ ├── bcl-plain.tar.bz2 │ │ ├── bcl-plain.tar.lz4 │ │ ├── bcl-plain.tgz │ │ └── empty_dir/ │ │ └── Data/ │ │ └── Intensities/ │ │ └── BaseCalls/ │ │ └── README │ ├── TestImputeFromReference/ │ │ ├── contigs.sub.ebov.fasta │ │ ├── expected.hhv3.mummer.fasta │ │ ├── expected.hhv3.muscle.fasta │ │ ├── expected.sub.ebov.impute.fasta │ │ ├── ref.sub.ebov.fasta │ │ └── test.pseudo.fasta │ ├── TestKMA/ │ │ └── ref.fasta │ ├── TestKbPython/ │ │ ├── palmdb.corona.idx │ │ ├── palmdb_clustered_t2g.txt │ │ └── palmdb_rdrp_seqs.corona.fa │ ├── TestKmers/ │ │ ├── ambig_bases.fasta │ │ ├── filt.fasta │ │ ├── palindromic_kmers.fasta │ │ ├── simple.fasta │ │ ├── simple.fasta.kmers.k4.txt │ │ └── tcgaattt.fasta │ ├── TestLastalDbBuild/ │ │ └── expected/ │ │ ├── TestLastalDbBuild.bck │ │ ├── TestLastalDbBuild.des │ │ ├── TestLastalDbBuild.prj │ │ ├── TestLastalDbBuild.sds │ │ ├── TestLastalDbBuild.ssp │ │ ├── TestLastalDbBuild.suf.md5 │ │ └── TestLastalDbBuild.tis │ ├── TestManualSnpCaller/ │ │ ├── indel.vcf.gz.tbi │ │ └── output.fasta │ ├── TestMetagenomicsSimple/ │ │ ├── db/ │ │ │ ├── library/ │ │ │ │ ├── Viruses/ │ │ │ │ │ ├── Bundibugyo_ebolavirus/ │ │ │ │ │ │ ├── GCF_000889155.1_ViralProj51245_genomic.fna │ │ │ │ │ │ └── GCF_000889155.1_ViralProj51245_protein.faa │ │ │ │ │ ├── Reston_ebolavirus/ │ │ │ │ │ │ ├── GCF_000854085.1_ViralProj15006_genomic.fna │ │ │ │ │ │ └── GCF_000854085.1_ViralProj15006_protein.faa │ │ │ │ │ ├── Sudan_ebolavirus/ │ │ │ │ │ │ ├── GCF_000855585.1_ViralProj15012_genomic.fna │ │ │ │ │ │ └── GCF_000855585.1_ViralProj15012_protein.faa │ │ │ │ │ ├── Tai_Forest_ebolavirus/ │ │ │ │ │ │ ├── GCF_000888475.1_ViralProj51257_genomic.fna │ │ │ │ │ │ └── GCF_000888475.1_ViralProj51257_protein.faa │ │ │ │ │ └── Zaire_ebolavirus/ │ │ │ │ │ ├── GCF_000848505.1_ViralProj14703_genomic.fna │ │ │ │ │ └── GCF_000848505.1_ViralProj14703_protein.faa │ │ │ │ └── prelim_map.txt │ │ │ └── taxonomy/ │ │ │ ├── accession2taxid/ │ │ │ │ ├── nucl_est.accession2taxid │ │ │ │ ├── nucl_gb.accession2taxid │ │ │ │ ├── nucl_gss.accession2taxid │ │ │ │ ├── nucl_wgs.accession2taxid │ │ │ │ ├── pdb.accession2taxid │ │ │ │ └── prot.accession2taxid │ │ │ ├── delnodes.dmp │ │ │ ├── gi_taxid_nucl.dmp │ │ │ ├── gi_taxid_prot.dmp │ │ │ ├── merged.dmp │ │ │ ├── names.dmp │ │ │ └── nodes.dmp │ │ ├── test-reads.bam │ │ ├── zaire_ebola.1.fastq │ │ ├── zaire_ebola.2.fastq │ │ └── zaire_ebola.bam │ ├── TestMetagenomicsViralMix/ │ │ ├── db/ │ │ │ ├── library/ │ │ │ │ ├── Viruses/ │ │ │ │ │ ├── Enterovirus_C/ │ │ │ │ │ │ ├── GCF_000861165.1_ViralProj15288_genomic.fna │ │ │ │ │ │ └── GCF_000861165.1_ViralProj15288_protein.faa │ │ │ │ │ ├── Hepatitis_C_virus/ │ │ │ │ │ │ ├── GCF_000861845.1_ViralProj15432_genomic.fna │ │ │ │ │ │ └── GCF_000861845.1_ViralProj15432_protein.faa │ │ │ │ │ ├── Tomato_mosaic_virus/ │ │ │ │ │ │ ├── GCF_000853705.1_ViralProj14926_genomic.fna │ │ │ │ │ │ └── GCF_000853705.1_ViralProj14926_protein.faa │ │ │ │ │ └── partial_pan-viral-9seqs-with-human-random-subset.fna │ │ │ │ └── prelim_map.txt │ │ │ └── taxonomy/ │ │ │ ├── accession2taxid/ │ │ │ │ ├── nucl_est.accession2taxid │ │ │ │ ├── nucl_gb.accession2taxid │ │ │ │ ├── nucl_gss.accession2taxid │ │ │ │ ├── nucl_wgs.accession2taxid │ │ │ │ ├── pdb.accession2taxid │ │ │ │ └── prot.accession2taxid │ │ │ ├── delnodes.dmp │ │ │ ├── gi_taxid_nucl.dmp │ │ │ ├── gi_taxid_prot.dmp │ │ │ ├── merged.dmp │ │ │ ├── names.dmp │ │ │ └── nodes.dmp │ │ └── test-reads.bam │ ├── TestMinimap2Idxstats/ │ │ ├── multi-viral-reads.bam │ │ └── multi-viral-refs.fasta │ ├── TestMiseqToBam/ │ │ ├── RunInfo.xml │ │ └── SampleSheet.csv │ ├── TestMvicuna/ │ │ ├── expected_pairedOut.1.fastq │ │ ├── expected_pairedOut.2.fastq │ │ ├── expected_unpairedOut.fastq │ │ ├── in.1.fastq │ │ └── in.2.fastq │ ├── TestOrderAndOrient/ │ │ ├── contig.mummer3_fail_lasv.fasta │ │ ├── contigs.ebov.doublehit.fasta │ │ ├── contigs.ebov.fasta │ │ ├── contigs.hhv3.fasta │ │ ├── contigs.hiv.big_indel.fasta │ │ ├── contigs.hiv.wrapped.fasta │ │ ├── contigs.influenza.fasta │ │ ├── contigs.lasv.fasta │ │ ├── contigs.lasv.one_small.fasta │ │ ├── expected.ebov.ambig.fasta │ │ ├── expected.ebov.doublehit.fasta │ │ ├── expected.ebov.small.fasta │ │ ├── expected.hhv3.fasta │ │ ├── expected.hiv.big_indel.alternates.fasta │ │ ├── expected.hiv.big_indel.fasta │ │ ├── expected.hiv.wrapped.fasta │ │ ├── expected.influenza.fasta │ │ ├── expected.lasv.ambig.fasta │ │ ├── expected.lasv.fasta │ │ ├── expected.lasv.promer.fasta │ │ ├── expected.refsel.ebov.stats.tsv │ │ ├── expected.refsel.lasv.stats.tsv │ │ ├── ref.ebov.gin.fasta │ │ ├── ref.ebov.lbr.fasta │ │ ├── ref.ebov.makona_C15.fasta │ │ ├── ref.ebov.sle.fasta │ │ ├── ref.ebov.small.fasta │ │ ├── ref.hhv3.fasta │ │ ├── ref.hiv.fasta │ │ ├── ref.influenza.fasta │ │ ├── ref.lasv.BNI_Nig08_A19.fasta │ │ ├── ref.lasv.ISTH2376.fasta │ │ ├── ref.lasv.KGH_G502.fasta │ │ ├── ref.lasv.nomatch.fasta │ │ ├── ref.lasv.pinneo.fasta │ │ └── refs.ebov.fasta │ ├── TestOrderOrientAndImputeFromReference/ │ │ ├── contigs.influenza.fasta │ │ ├── expected.influenza.impute.mafft.fasta │ │ ├── expected.influenza.impute.mummer.fasta │ │ ├── expected.influenza.impute.muscle.fasta │ │ └── ref.influenza_partial.fasta │ ├── TestPerSample/ │ │ ├── in.2libs.bam │ │ ├── in.2libs3rgs.bam │ │ ├── in.3libs.bam │ │ ├── in.bam │ │ ├── in.indels.bam │ │ ├── in.oneunmapped.bam │ │ ├── ref.fasta │ │ ├── ref.fasta.fai │ │ ├── ref.indels.fasta │ │ ├── ref.indels.fasta.fai │ │ ├── vphaser_one_sample_2libs_expected.txt │ │ ├── vphaser_one_sample_3libs_expected.txt │ │ ├── vphaser_one_sample_expected.txt │ │ └── vphaser_one_sample_indels_expected.txt │ ├── TestPurgeUnmated/ │ │ ├── expected1.fastq │ │ ├── expected2.fastq │ │ ├── in1.fastq │ │ ├── in2.fastq │ │ ├── in_sra1.fastq │ │ └── in_sra2.fastq │ ├── TestRefineAssembly/ │ │ ├── expected.ebov.refine1.fasta │ │ ├── expected.ebov.refine1.freebayes.fasta │ │ ├── expected.ebov.refine1.new.fasta │ │ ├── expected.ebov.refine2.fasta │ │ ├── expected.ebov.refine2.freebayes.fasta │ │ └── impute.ebov.fasta │ ├── TestRmdupUnaligned/ │ │ ├── expected.bam │ │ └── input.bam │ ├── TestRunInfo/ │ │ ├── RunInfo-hiseq.xml │ │ ├── RunInfo-miseq.xml │ │ ├── RunInfo-nextseq-1000-2000-p1.xml │ │ ├── RunInfo-nextseq550.xml │ │ ├── RunInfo-novaseq-x-plus.xml │ │ ├── RunInfo-novaseq.xml │ │ ├── RunInfo-novel-fcid-and-tilecount.xml │ │ ├── RunInfo-novel-fcid.xml │ │ └── RunInfo-novel-tile-count.xml │ ├── TestSampleSheet/ │ │ ├── SampleSheet-AEHWY-subset.csv │ │ ├── SampleSheet-custom-1.txt │ │ ├── SampleSheet-custom-1_macos9-endings.txt │ │ ├── SampleSheet-custom-1_win-endings.txt │ │ ├── SampleSheet-custom-2.txt │ │ ├── SampleSheet-custom-2_win-endings.tsv │ │ ├── SampleSheet-custom-inner-barcodes-outer-collapse.tsv │ │ ├── SampleSheet-hiseq-1.csv │ │ ├── SampleSheet-in-Broad-MiSeq-Format_with_Picard_Block.csv │ │ ├── SampleSheet-miseq-1.csv │ │ ├── SampleSheet-submit-1.csv │ │ ├── SampleSheet-submit-2.csv │ │ ├── SampleSheet-submit-3.csv │ │ └── SampleSheet-with-blanklines.csv │ ├── TestSkaniReferenceSelection/ │ │ ├── RVA_DQ473496.1_Rhinovirus_A49.fa │ │ ├── RVA_DQ473498.1_Rhinovirus_A10.fa │ │ ├── RVA_DQ473499.1_Human_rhinovirus_A44.fa │ │ ├── RVA_DQ473501.1_Rhinovirus_A34.fa │ │ ├── RVA_DQ473507.1_Rhinovirus_A53.fa │ │ ├── RVA_FJ445116.1_Human_rhinovirus_13_strain_ATCC_VR-1123.fa │ │ ├── RVA_FJ445140.1_Human_rhinovirus_56_strain_ATCC_VR-1166.fa │ │ ├── RVA_FJ445177.1_Human_rhinovirus_9_strain_ATCC_VR-489.fa │ │ ├── RVA_GQ223229.1_Human_rhinovirus_A_isolate_N13.fa │ │ ├── RVA_L24917.1_Human_rhinovirus_type_16_polyprotein_gene.fa │ │ └── USA-MA-Broad_BWH-19947-2023.l000013249603_C5.HTKJ7DRX3.1.acellular.dedup.assembly1-spades.fasta │ ├── TestSnpEff/ │ │ ├── RBV16.fasta │ │ ├── ann_eff.vcf.gz.tbi │ │ ├── merged.vcf.gz.tbi │ │ ├── msa.fasta │ │ └── ref-rabies-JQ685920.fasta │ ├── TestSplitReads/ │ │ ├── expected.fasta.01 │ │ ├── expected.fasta.02 │ │ ├── expected.fastq.01 │ │ ├── expected.fastq.02 │ │ ├── expected.fastq.03 │ │ ├── expected.fastq.1 │ │ ├── expected.fastq.2 │ │ ├── in.fasta │ │ └── in.fastq │ ├── TestSplitcodeDemuxFastqs/ │ │ ├── RunInfo.xml │ │ ├── SampleSheet.csv │ │ ├── samples_3bc.tsv │ │ ├── samples_3bc_i5_rc_with_n.tsv │ │ └── samples_3bc_i5_revcomp.tsv │ ├── TestSplitcodeDemuxIntegration/ │ │ ├── RunInfo.xml │ │ └── SampleSheet.tsv │ ├── TestSplitcodeLookupTable/ │ │ ├── AAAAAAAA-TTTTTTTT.lLibA_summary.json │ │ ├── ATCGATCG-GCTAGCTA.lB1_summary.json │ │ ├── ATCGATCG-GCTAGCTA.lL1_summary.json │ │ ├── GGGGGGGG-CCCCCCCC.lLibB_summary.json │ │ ├── TTTTAAAA-CCCCGGGG.lB2_summary.json │ │ ├── sample_sheet_basic.tsv │ │ ├── sample_sheet_multi_pool.tsv │ │ ├── sample_sheet_unique_lib_ids.tsv │ │ └── sample_sheet_zero_reads.tsv │ ├── TestTarballMerger/ │ │ ├── mixed-compressed-input/ │ │ │ ├── file2.tar.lz4 │ │ │ ├── file3.tar.zst │ │ │ └── file4.tar.bz2 │ │ └── raw-input/ │ │ ├── file1 │ │ ├── file2 │ │ ├── file3 │ │ └── file4 │ ├── TestTaxonomy/ │ │ └── simple.m8 │ ├── TestToolKrakenExecute/ │ │ ├── empty-report.txt │ │ ├── expected-kraken-mix.reads.txt │ │ └── expected-kraken-mix.report.txt │ ├── TestToolNovoalign/ │ │ └── ebov_reads.bam │ ├── TestToolPicard/ │ │ ├── in.dict │ │ ├── in.fasta │ │ ├── messy-headers.fasta │ │ └── simple.sam │ ├── TestToolSamtools/ │ │ ├── in.fasta │ │ ├── in.fasta.fai │ │ ├── indel_cigar.sam │ │ └── simple.sam │ ├── TestTrimRmdupSubsamp/ │ │ └── clipDb.fasta │ ├── TestTrimmomatic/ │ │ ├── clip.fasta │ │ ├── empty.fastq │ │ ├── expected1.fastq │ │ ├── expected1.maxinfo.fastq │ │ ├── expected2.fastq │ │ ├── expected2.maxinfo.fastq │ │ ├── in1.fastq │ │ └── in2.fastq │ ├── TestTsvJoin/ │ │ ├── expected-out.txt │ │ ├── tab-1.txt │ │ └── tab-2.txt │ ├── TestUtilMisc/ │ │ ├── cfg1.yaml │ │ ├── cfg2.yaml │ │ ├── cfg_std.yaml │ │ └── empty.yaml │ ├── TestVPhaser2/ │ │ ├── expected.cpickle │ │ ├── in.bam │ │ └── in.bam.bai │ ├── almost-empty-2.bam │ ├── almost-empty.bam │ ├── broken.bam │ ├── ebola.fasta │ ├── ebola.fasta.bz2 │ ├── ebola.fasta.lz4 │ ├── ebola.fasta.zst │ ├── ebov-makona.fasta │ ├── empty.bam │ ├── empty.fasta │ ├── one_gene.vcf.gz.tbi │ ├── ref.lasv.fasta │ └── s3/ │ └── sabeti-public-dbs/ │ ├── blast/ │ │ ├── hybsel_probe_adapters.fasta │ │ ├── hybsel_probe_adapters.nhr │ │ ├── hybsel_probe_adapters.nin │ │ ├── hybsel_probe_adapters.nsq │ │ ├── metag_v3.ncRNA.mRNA.mitRNA.consensus.dict │ │ ├── metag_v3.ncRNA.mRNA.mitRNA.consensus.fasta.fai │ │ ├── metag_v3.ncRNA.mRNA.mitRNA.consensus.nhr │ │ ├── metag_v3.ncRNA.mRNA.mitRNA.consensus.nin │ │ ├── metag_v3.ncRNA.mRNA.mitRNA.consensus.nix │ │ └── metag_v3.ncRNA.mRNA.mitRNA.consensus.nsq │ ├── bmtagger/ │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.bitmask │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.amp │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.idx │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.imp │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.pmp │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.rmp │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.ss │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.ssa │ │ ├── GRCh37.68_ncRNA-GRCh37.68_transcripts-HS_rRNA_mitRNA.srprism.ssd │ │ ├── hg19.bitmask │ │ ├── hg19.srprism.amp │ │ ├── hg19.srprism.idx │ │ ├── hg19.srprism.imp │ │ ├── hg19.srprism.pmp │ │ ├── hg19.srprism.rmp │ │ ├── hg19.srprism.ss │ │ ├── hg19.srprism.ssa │ │ ├── hg19.srprism.ssd │ │ ├── metagenomics_contaminants_v3.bitmask │ │ ├── metagenomics_contaminants_v3.readme.txt │ │ ├── metagenomics_contaminants_v3.srprism.amp │ │ ├── metagenomics_contaminants_v3.srprism.idx │ │ ├── metagenomics_contaminants_v3.srprism.imp │ │ ├── metagenomics_contaminants_v3.srprism.pmp │ │ ├── metagenomics_contaminants_v3.srprism.rmp │ │ ├── metagenomics_contaminants_v3.srprism.ss │ │ ├── metagenomics_contaminants_v3.srprism.ssa │ │ └── metagenomics_contaminants_v3.srprism.ssd │ ├── bwa/ │ │ ├── hg19.amb │ │ ├── hg19.ann │ │ ├── hg19.bwt │ │ ├── hg19.pac │ │ └── hg19.sa │ ├── kaiju/ │ │ └── nr/ │ │ └── nr.fmi │ ├── krakenuniq/ │ │ ├── database.idx │ │ ├── database.jdb │ │ ├── database.kdb │ │ └── lca.complete │ ├── krona/ │ │ └── taxonomy.tab │ ├── rna_bwa/ │ │ ├── human_viral_rrna.amb │ │ ├── human_viral_rrna.ann │ │ ├── human_viral_rrna.bwt │ │ ├── human_viral_rrna.pac │ │ └── human_viral_rrna.sa │ ├── spikeins/ │ │ └── ercc_spike-ins.fasta │ ├── taxonomy/ │ │ ├── merged.dmp │ │ ├── names.dmp │ │ └── nodes.dmp │ └── trim_clip/ │ └── contaminants.fasta └── unit/ ├── assemble/ │ ├── test_assembly.py │ ├── test_assembly_integration.py │ └── test_util_vcf.py ├── classify/ │ ├── __init__.py │ ├── fixtures.py │ ├── test_integration_kb.py │ ├── test_integration_kraken2.py │ ├── test_integration_taxon_filter.py │ ├── test_kmer_utils.py │ ├── test_metagenomics.py │ ├── test_taxon_filter.py │ ├── test_taxonomy.py │ ├── test_tools_kb_python.py │ ├── test_tools_kma.py │ └── test_tools_krona.py ├── core/ │ ├── test_conftest.py │ ├── test_file_utils.py │ ├── test_illumina.py │ ├── test_read_utils.py │ ├── test_tools.py │ ├── test_tools_bbmap.py │ ├── test_tools_bwa.py │ ├── test_tools_fastqc.py │ ├── test_tools_minimap2.py │ ├── test_tools_novoalign.py │ ├── test_tools_picard.py │ ├── test_tools_sambamba.py │ ├── test_tools_samtools.py │ ├── test_tools_splitcode.py │ ├── test_tools_trimmomatic.py │ ├── test_util_file.py │ └── test_util_misc.py └── phylo/ ├── __init__.py ├── test_interhost.py ├── test_intrahost.py ├── test_ncbi.py ├── test_tools.py ├── test_tools_vphaser2.py └── test_util_vcf.py